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前 言 
为 什么 编写 本 书 


Java 语 言 于 1995 年 首次 公开 发 布 ， 很 快 便 取 
得 了 巨大 的 成 功 ， 成 为 使 用 最 为 广泛 的 编程 语言 
之 一 。 到 现在 ，Java 已 经 经 历 了 20 多 个 年 头 。 在 
这 期 间 ， 无 论 是 Java 语 言 本 身 还 是 Java 虚 拟 机 技 
术 ， 都 取得 了 长 足 的 进步 。 现 如 今 ，Java 依 然 长 
期 占据 TIOBE 上 网 站 的 编程 语言 排行 榜首 。 最 近 
更 是 被 TIOBE 选 为 2015 年 度 编程 语言 ! 沾 ， 风 采 可 
请 不 减 当年 。 


众所周知 ，Java 时 已 不 仅仅 是 一 个 单纯 的 语 
言 ， 而 是 一 个 开放 的 平台 。 活 了 路 在 这 个 平台 之 上 
的 编程 语言 除了 Java 之 外 ， 还 有 Groovy ”| 、Scala 


中、GClojure 、Jython il 和 JRuby1 1 等。Java 虚 
拟 机 则 是 支持 这 个 平台 的 基石 。 


市 面 上 教授 Java 语 言 的 书籍 种 类 贮 多 ， 相 比 
之 下 ， 介 绍 Java 虚 拟 机 的 书籍 却 是 凤 毛 记 角 。 这 
足以 说 明 Java 作 为 一 门 高 级 语言 是 多 么 成 功 〈 让 
程序 员 远 离 底 层 ) ,但 并 不 代表 Java 虚 拟 机 技术 
不 重要 。 人 恰恰 相反 ， 当 Java 语 言 掌握 到 一 定 程度 
时 ，Java 庶 拟 机 原理 目 然 殉 会 成 为 必须 越过 的 一 
道 鸿沟 。 


近 几 年 ， 国 内 涌现 出 了 一 些 讨 论 Java 虚 拟 机 
技术 的 优秀 书籍 ， 这 些 书籍 主要 以 分 析 OpenJDK 
或 Oracle JDK 为 主 。 本 书 万 尽 蹊 径 ， 市 领 谈 着 目 
己 动 手 从 委 开 始 用 Go 语言 编写 Java 虚 拟 机 。 这 样 
做 好 处 颇 多 ， 弥 补 了 OpenJDK 等 虚拟 机 的 不 足 。 


目 完 ，OpenJDK 等 虚拟 机 实现 非常 复杂 。 对 
于 初学 者 而 言 ， 很 容易 陷入 代码 的 海洋 和 不 必要 
的 细节 之 中 。 其 次 ，OpenJDK 等 虚拟 机 大 多 用 
C++ 语言 编写 。 C++ 语言 非 党 复杂， 理解 起 来 难 
度 很 大 。 最 后 ， 单 纯 阅 读 代 码 比较 乏味 ， 缺 少 乐 
趣 ， 而 脱离 代码 又 很 难 透 彻 讨论 技 术 。 通 过 目 己 
动手 编写 代码 ， 很 好 地 避免 了 上 壕 问 题 。 看 着 日 
己 实现 的 Java 虚 拟 机 功能 逐渐 增强 ， 看 到 可 以 运 
行 的 Java 程 序 越 来 越 复杂 ， 成 束 感 非常 强 。 总 
之 ， 通 过 实践 的 方式 ， 相 信 读 者 可 以 更 深刻 地 领 
悟 Java 虚 拟 机 的 工作 原理 。 


Go 是 Google 公 司 于 2012 年 推出 的 系统 编程 语 
言 。 从 到 人 硬件 的 距离 来 看 ，Go 语 言 介 于 C 和 Java 
之 间 。Go 的 语法 和 C 类 似 ， 但 更 加 简洁 ， 因 此 很 


容易 学 习 。Go 语 言 内 置 了 丰富 的 基本 数据 类 型 ， 
并 且 文 持 结 构 体 ， 所 以 很 适合 用 来 实现 Java 虚 拟 
机 。Go 文 择 指 针 ， 但 并 不 文 持 指针 运算 ， 因 此 用 
Go 编写 的 代码 要 比 C 代 码 更 加 安全 。 此 外 ，Go 还 
支持 垃圾 回收 和 接口 等 Java 类 语言 中 才 有 的 功 
能 ， 大 大 降低 了 实现 Java 虚 拟 机 的 难度 。 


以 上 是 本 书 采 用 Go 语言 编写 Java 虚 拟 机 的 原 
因 ， 希 望 读者 在 学 习 本 书 的 过 程 中 ， 可 以 喜欢 上 
Go 这 门 还 很 年 轻 的 语言 。 


本 书 主要 内 容 
全 书 一 共 分 为 11 章 ， 各 草 内 容 安排 如 下 : 


第 1 草 : 安 猴 开发 环境 ， 讨 论 java 命 令 ， 并 编 


写 一 个 类 似 Java 的 命令 行程 序 。 


第 2 草 : 讨论 Java 虚 拟 机 如 何 搜索 class 文 件 ， 
实现 类 路 径 。 


第 3 章 : 讨论 Class 文件 结构 ， 实 现 class 文 件 解 
析 。 


第 4 章 : 讨论 运行 时 数据 区 ， 实 现 线 程 私 有 的 
运行 时 数据 区 ， 包 括 线 程 、Java 虚 拟 机 栈 、 栈 
帧 、 操 作 数 栈 和 局 部 变量 表 等 。 

第 5 章 : 讨论 Java 虚 拟 机 指令 集 和 解释 器 ， 实 
现 解释 器 和 150 余 条 指令 。 

第 6 章 : 讨论 类 、 对 象 以 及 线程 共享 的 运行 时 


数据 区 ， 实 现 类 加 载 融 、 方 法 区 以 及 部 分 引用 类 


巴 公 
= 


第 7 章 ， 讨 论 方法 调用 和 返回 ， 实 现 方法 调用 
和 返回 指令 。 

第 8 章 ， 讨 论 数 组 和 字符 串 ， 实 现 数组 相关 指 
令 和 字符 串 池 。 

第 9 章 ， 讨 论 本 地 方法 调用 ， 实 现 


ObjecthashCode () 等 本 地 方法 。 


第 10 章 : 讨论 异常 处 理 机 市， 实现 athrow 指 


今 o 
第 11 章 : 讨论 System 类 的 初始 化 过 程 和 
System.out.println () 的 工作 原理 等 ， 并 对 全 书 进 


/二 ~ 1] 二 
了 忆 结 


本 书面 癌 读 着 


本 书 主要 面向 有 一 定 经 验 的 Java 程 序 员 ， 但 
任何 对 Java 虚 拟 机 工作 原理 感 兴趣 的 读者 都 可 以 
从 本 书 获 益 。 如 前 所 述 ， 本 书 将 使 用 Go 语言 实现 
Java 虚 拟 机 。 书 中 会 简要 介绍 Go 语言 的 部 分 语法 
以 及 与 Java 语 言 的 区 别 ， 但 不 会 深入 讨论 。 由 于 
Go 语言 相对 比较 简单 ， 相 信任 何 有 C 系 列 语言 
(如 C、C++、C#、Objective-C、Java 等 ) 经 验 的 
读者 都 可 以 轻松 读 懂 书 中 的 源 代码 。 


如 何 阅 谈 本 书 


本 书 代码 经 过 精心 调整 ， 每 一 章 (第 1 革除 
外 ) 都 建立 在 前 一 章 的 基础 上 ， 但 每 一 章 又 都 可 
以 单独 编译 和 运行 。 本 书 内 容 主 要 围绕 代码 对 
Java 虚 拟 机 展开 讨论 。 读 者 可 以 从 第 1 草 开 始 ， 按 
顺序 阅读 本 书 并 运行 每 一 章 的 产 代 码 ， 也 可 以 直 


接 跳 到 感 兴趣 的 章 世 阅读 ， 必 要 时 再 阅读 其 他 章 


本 书 主 要 参考 了 下 面 这 些 锅 料 : 


《Java 虚 拟 机 规范 》 第 8 版 


一 
ddl 
一 


-《Java 语 言 规范 》 人 第 8 和 版 
《深入 Java 虚 拟 机 》 ( 原 书 第 2 版 ) 18| 


其 中 《Java 庶 拟 机 规范 》 主 要 参考 了 第 8 版 ， 
但 同时 也 参考 了 第 7 版 和 更 老 的 版 本 。《Java 语 言 
规范 》 则 主要 参考 了 第 8 版 。 该 痢 可 以 从 


http://docs.oracle.com/javase/specs/index.html 获取 


各 个 版 本 的 《Java 庶 拟 机 规范 》 和 《Java 语 言 规 


汇 》。 


笔者 早 在 十 年 前 还 在 上 学 时 束 读 过 由 Bill 

Venners 得 ， 曹 晓 钢 等 翻译 的 《深入 Java 虚 拟 机 

( 原 书 第 2 版 ) 》。 但 是 由 于 当时 水 平 有 限 ， 理 解 
得 并 不 是 很 深入 。 时 隅 十 年 ， 重 读 此 书 还 是 跨 有 
收获 。 较 之 《Java 庶 拟 机 规范 》 的 闫 谍 和 刻板 ， 
该 书 更 加 通俗 易 懂 。 原 书 作 者 已 经 将 部 分 章 广 放 
于 网 上 ， 网 址 是 
http://www.artima.com/insidejvm/ed2/ ， 读 者 可 以 
免 响 阅读 。 


以 上 是 Java 方 面 的 资料 。Go 语 言 方面 主要 参 
考 了 Go 家 网 上 的 各 种 资料 ， 包 括 《 如 何 编写 Go 程 
序 》01 《Effective Go》 1410 《Go 语言 规范 》 1 


以 及 Go 标准 库 文档 中 等 。 另 外 ， 在 本 书 的 写作 
过 程 中 ， 笔 者 还 通过 搜索 引擎 查阅 了 遍布 于 网 络 
上 (特别 是 StackOverflow131 和 Wikipedia 1141 ) 
的 各 种 资料 ， 这 里 就 不 一 一 罗列 了 。 


下 载 本 书 产 代码 


本 书 源 代码 可 以 从 
https://github.com/zxh0/jvmgo-book 获取 。 代 码 分 
为 Go 和 Java 两 部 分 ， 目 条 结构 如 下 : 


https://github.com/zxh0O/jvmgo-book/vi/code/ 


| -java 
|-example 


Go 语言 部 分 是 Java 虚 拟 机 代码 ， 每 章 为 一 个 
子 目 录 ， 可 以 独立 编译 和 运行 。Java 语 言 


Java 示 例 人 代码， 每 章 为 一 个 包 。Java 代 码 按照 
Gradle 11 工程 标准 目录 结构 组 织 ， 可 以 用 Gradle 
编译 整个 工程 ， 也 可 以 用 javac 分 别 编译 每 个 文 
人 


勘误 和 文 持 


《Java 虚 拟 机 规范 》 对 Java 虚 拟 机 的 工作 机 制 
有 十 分 疗 译 的 插 述 。 但 十 由 于 笔 兰 水 平和 表达 能 
力 有 限 ， 本 书 一 定 存在 表述 不 精确 、 不 准确 ， 甚 
至 不 正确 的 地 方 。 男 外 ， 由 于 时 间 有 限 ， 书 中 也 
难免 会 有 一 些 玖 源 之 处 ， 还 请 读者 度 解 。 


本 书 的 勘误 将 通过 
https://github.com/zxh0/jvmgo- 
book/blob/master/v1/errata.md 发 布 和 更 新 。 如 果 


读者 发 现 书 中 的 错误 、 有 改进 意见 ， 或 者 有 任何 
问题 需要 讨论 ， 都 可 以 在 本 书 的 Github 项 目 上 创 
建 Issue。 此 外 也 可 以 加 入 QQ 群 (470333113) 与 


读 首 交流 。 
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可 以 全 心 投入 本 书 的 写作 之 中 。 
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第 1 章 ”命令 行 工具 


Java 虚 拟 机 非常 复 洒 ， 要 想 真 正 理解 它 的 工 
作 原 理 ， 最 好 的 方式 束 古 目 己 动手 写 一 个 。 本 书 
的 目的 就 是 带领 读者 按照 Java 虚 拟 机 规范 趾 ， 从 
零 开 始 ， 一 步 一 步 用 Go 语言 实现 一 个 功能 逐步 增 
强 的 Java 虚 拟 机 。 第 1 章 将 编写 一 个 类 似 java 的 
命令 行 工 具 ， 用 它 来 局 动 我们 目 己 的 虚拟 机 。 在 
开始 编写 代码 之 前 ， 需 要 先 准 备 好 开发 环境 。 


本 书 假定 读者 使 用 的 是 Windows 操 作 系 统 ， 
因此 书 中 出 现 的 命令 和 路 径 等 都 是 windows 形 式 
的 。 如 有 果 读 者 使 用 的 是 其 他 操作 系统 (如 Mac OS 
X、Linux 等 ) ， 需 要 根据 自己 的 情况 做 出 相应 调 


整 。 由 于 Go 和 Java 都 是 跨 平台 语言 ， 所 以 本 书 代 
码 在 常见 的 操作 系统 中 都 可 以 正常 编译 和 运行 。 


[1] 如 无 特殊 说 明 ， 本 书 中 出 现 的 "Java 庶 拟 机 规 
范 ” 均 指 《Java 虚 拟 机 规范 第 8 版 ”， 网 址 为 
http://docs.oracle.com/javase/specs/jvms/se8/html/in 
dex.html ° 

[2] 后 文中 ， 上 月 子 母 小 写 的 java 符 指 java 命 令 行 工 
具 。 


1.1 准备 工作 
1.1.1 安装 JDK 


我 们 都 知道 ， 要 想 运 行 Java 程 序 ， 只 有 Java 虚 
拟 机 是 不 够 的 ， 还 需要 有 Java 类 库 。Java 虚 拟 机 和 
Java 类 库 一 起 ， 构 成 了 Java 运 行 时 环境 。 本 书 编写 
的 Java 虚 拟 机 依赖 于 JDK 类 库 ， 男 外 ， 编 译本 书 中 
的 Java 示 例 代 人 码 也 需要 JDK。 从 Oracle 网 站 上 上 下 
载 最 新 版 本 〈 写 作 本 章 时 是 8u66) 的 JDK 安 狠 文 
件 ， 双 击 运 行 即 可 。 安 效 完 毕 之 后 ， 打 开 命令 行 
窗口 执行 java-version 命 令 ， 如 来 看 到 类 似 图 1-1 所 
示 的 输出 ， 残 证 明 安 闭 成 功 了 。 


命令 提示 符 


D:\>java -Version 
java version “1.8.0 66” 


Java(TID) SE Runtime Fnvironment (buildad 1.8.0 66-b18) 
Java HotSpot (TH) 64-Bit Server YM (build 25. 66-b18，mixed mode) 


图 1-1 java-version 命 令 输 出 
[1] 
http:/www.oracle.com/technetwork/java/javase/down 


loads/index.html ° 


天 


1.1.2 ”安装 Go 


从 Go 语言 官网 由 下 载 最 新 版 本 〈 写 作 本 章 时 
是 1.5.1) 的 Go 安装 文件 ， 双 击 运行 即 可 。 安 装 完 
毕 之 后 ， 打 开 命 令 行 窗口 执行 go version 命 令 ， 妇 
果 看 到 类 似 图 1-2 所 示 的 输出 ， 就 证 明 安 装 成 功 


| 


D:\>go version 


go version gol.5.1 windows/amd64 


D:\> 


图 1-2 ”go version 命 令 输 出 
go | 命令 是 Go 语言 提供 的 命令 行 工具 ， 用 来 
管理 Go 源 代 码 。go 命 令 束 像 瑞士 军刀 ， 里 面包 合 
了 各 种 小 工具 。 用 Go 语言 编写 程序 ， 基 本 上 只 需 


要 go 命令 职 可 以 了 。go 命 令 里 的 小 工具 是 各 种 子 
命令 ，version 是 其 中 之 一 。 其 他 和 常用 的 子 命 令 包 


括 heljp、fmt、install 和 test 等 。 


go 命令 行 工 具 硕 望 所 有 的 Go 源 代 码 航 者 放 在 
一 个 工作 空间 中 。 所 谓 工 作 空间 ， 实 际 上 就 是 一 
个 目录 结构 ， 这 个 目录 结构 包公 二 个 子 目录 。 


:Src 目 永 中 是 Go 语言 源 代 人 码 。 
-pkg 目 孙 中 征 编译 好 的 包 对 象 文 件 。 
-bin 目 孙 中 是 链接 好 的 可 执行 文件 。 


实际 上 只 有 src 目 录 是 必须 要 有 的 ，go 会 上 自动 
创建 pkg 和 bin 目 录 。 工 作 空间 可 以 位 于 任何 地 方 ， 
本 书 使 用 D: \govworkspace 作 为 工作 空间 。 那 么 go 
如 何 知道 工作 至 间 在 哪里 呢 ? 答案 是 通过 


GOPATH 环 境 变 量 。 在 果 面 上 右键 单 击 “ 我 的 电 
脑 * 图 标 ， 在 弹出 的 采 早 中 单 击 “ 属 性 ”， 然 后 蛙 
击 “ 高 级 系统 设置 "， 在 “系统 属性 ”对 话 框 中 单 
击 “ 环 境 变 量 ” 按 钮 ， 人 然后 添加 GOPATH 变 量 即 可 ， 
如 图 1-3 所 示 。 


系统 变量 (9) 


| 变量 值 ^ 
ComSpec C\Windows\system32\cmd.exe 

GOROOT C\Go\ 

NUMBER OF PROCESSORS 1 

| OS Windows_NT 


出 除 D | 


图 1-3 ”设置 GOPATH 环 境 变量 


打开 命令 行 窗 口 ， 执 行 go env 人 命令， 如果 看 到 
类 似 图 1-4 所 示 的 输出 ，GOPATH 环 境 变 量 就 设置 
成 功 了 。 


吨 命令 提示 符 | 


set 60OEJE=. exe 
set GOHOSTARCH=amd64 


set GOHOSTOS=windows 

set GOOS=windows 

set GOPATH=D: \go\workspace 
set GORACE= 


图 1-4 使 用 go env 命 令 查 看 GOPATH 环 境 变 量 
[1] https://golang.org/dl/ 如果 Go 官 网 无 法 访问 ， 
可 以 从 http://golangtc.com/download) 下 载 。 
[2] 后 文中 ， 首 字母 小 写 的 go 特 指 go 命令 行 工 具 。 


1.1.3 创建 目 永 结构 


Go 语言 以 包 为 单位 组 织 源 代 码 ， 包 可 以 骨 
套 ， 形 成 层次 天 系 。 本 书 编写 的 Go 源 文 件 全 部 帮 
在 jvmgo 包 中 ， 其 中 每 一 章 的 源 文 件 又 分 别 放 在 目 
己 的 子 包 中 。 包 层次 和 目 孙 绪 构 有 一 个 商 单 的 对 
应 关系， 比如 ， 第 1 章 的 代码 在 jvmgo\ch01 目 条 
下 。 除 第 1 章 以 外 ， 每 一 章 都 是 先 复制 前 一 章 代 
码 ， 然 后 进行 修改 和 完善 。 每 一 草 的 代码 都 钙 独 
立 有 的 ， 可 以 单独 编译 为 一 个 可 执行 文件 。 下 面 创 
建 第 1 章 的 目 孙 结构 。 


在 D: \go\Wwworkspace\src (也 就 
是 %GOPATH%\src) 目 永 下 创建 jvmgo 目 未 ， 在 


jvmgo 目 永 下 创建 ch01 目 未 。 现 在 ， 工 作 空间 的 目 
永 结构 如 下 : 


|-jvmgo 
|-cho1 


1.2 ”java 命令 


Java 虚 拟 机 的 工作 是 运行 Java 应 用 程序 。 和 其 
他 类 型 的 应 用 程序 一 样 ，Java 应 用 程序 也 需要 一 个 
入 口 操 ， 这 个 入 口 点 就 古 我 们 熟知 的 main () 方 
法 。 如 果 一 个 类 包含 main () 方法 ， 这 个 类 就 可 
以 用 来 启动 Java 应 用 程序 ， 我 们 把 这 个 类 叫 作 主 
类 。 最 人 简单 的 Java 程 序 是 只 有 一 个 main () 方法 的 
类 ， 如 著名 的 HelloWorld 程 序 。 


public class Helloworld { 
public static void main(String[] args) { 
System.out.printlin("Hello, world!"); 


那么 Java 庶 拟 机 如 何 知 着 我 们 要 从 哪个 尖 局 动 
应 用 程序 呢 ? 对 此 ，Java 庶 拟 机 规范 没有 明确 规 


定 。 也 残 是 说 ， 是 由 虚拟 机 实现 目 行 决定 的 。 比 
如 Oracle 的 Java 庶 拟 机 实现 是 通过 java 命 令 来 局 动 
的 ， 主 类 名 由 命令 行 参数 指定 。java 命 令 有 如 下 4 
种 形式 : 


java [-options] class [args] 

java [-options] -jar jarfile [args] 
javaw [-options] class [args] 

javaw [-options] -jar jarfile [args] 


可 以 向 java 命 令 传递 三 组 参数 : 选项 、 主 类 名 
(或 者 JAR 文 件 名 ) 和 main () 方法 参数 。 选 项 由 
减 号 (-) 开头 。 通 常 ， 第 一 个 非 选 项 参数 给 出 主 
类 的 完全 限定 名 (fully qualified class name) 。 但 
是 如 果 用 户 提 供 了 -jar 选 项 ， 则 第 一 个 非 移 项 参数 
表示 JAR 文 件 名 ，java 命 令 必须 从 这 个 JAR 文 件 中 
寻找 主 类 。javaw 命 令 和 java 命 令 几 乎 一样 ， 唯 一 
的 差别 在 于 ，javaw 命 令 不 显示 命令 行 帘 口 ， 因 此 


特别 适合 用 于 局 动 GUI (图 形 用 户 界 面 ) 应 用 程 
序 。 


选项 可 以 分 为 两 尖 : 标准 远 项 和 非 标 准 碗 
项 。 标 准 选项 比较 稳定 ， 不 会 轻易 变动 。 非 标准 
选项 以 -X 开 头 ， 很 有 可 能 会 在 末 来 的 版 本 中 弯 
化 。 非 标准 选项 中 有 一 部 分 是 局 级 选项 ， 以 -XX 开 


十 
头 。 表 1-1 列 出 了 java 命 令 第 用 的 选项 及 其 用 途 。 
[1] 


选 项 用 途 
-Version 输出 版 本 信息 ， 然 后 退出 
-?/-help 输出 帮助 信息 ， 然 后 退出 
-cp / -classpath 指定 用 户 类 路 径 
-Dproperty=value 设置 Java 系统 属性 
-Xms<size> 设置 初始 堆 空间 大 小 
-Xmx<size> 设置 最 大 堆 空 间 大 小 
-Xss<size> 设置 线程 栈 空间 大 小 


[1] 完整 的 java 命令 用 法 请 参考 


http://docs.oracle.com/javase/8/docs/technotes/tools/ 


windows/java.html 。 


1.3 编写 命令 行 工 具 


开发 环境 已 经 准备 束 绕 ，java 命 令 也 已 经 介 
绍 完 秆 ， 相 信访 着 已 经 迫 不 及 行 想 开始 写 代 码 了 
吧 ! 下 面 根据 java 命 令 的 第 一 种 用 法 ， 目 己 动 手 
编写 一 个 类 似 的 命令 行 工 具 。 


先是 义 一 个 结构 体 来 表示 命令 行 选项 和 参 
数 。 在 ch01 目 录 下 创建 cmd.go 文 件 ! 中 ， 用 你 喜欢 
的 文本 编辑 器 打开 它 ， 然 后 在 其 中 定义 Cmd 结 
构 体 ， 代 码 如 下 : 


package main 
import "flag" 
import "fmt" 
import "os" 

type Cmd struct { 


helpFlag bool 
versionFlag bool 
cpOption string 


class string 


args []string 


在 Java 语 诗 中 ，API 一 般 以 类 库 的 形式 提供 。 
在 Go 语言 中 ，API 则 是 以 包 (package) 的 形式 提 
供 。 包 可 以 同 用 户 提 供 闻 量 、 变 量 、 绪 构 体 以 及 
畏 效 等 。Java 内 置 了 丰 曙 的 类 库 ，Go 也 同 梓 内 阐 
了 功能 强大 的 包 。 本 草 将 用 到 fmt、os 和 flag 包 。 


0s 包 定义 了 一 个 Args 变 量 ， 其 中 存放 传递 给 
行 的 全 部 参数 。 如 来 直接 处 理 0s.Args 变 量 ， 
多 代码 。 还 好 Go 语言 内 前 了 flag 包 ， 这 
个 包 可 以 帮助 我 们 处 理 命令 行 选项 。 有 了 flag 包 ， 
我 们 的 工作 惑 简单 了 很 多 。 继 续 编 和 辑 cmd.go 文 
件 ， 在 其 中 定义 parseCmd () 函数 中 ， 代 码 如 


func parseCmd() *Cmd { 
cmd := &Cmd{} 
flag.Usage = printUsage 
flag.BoolVar(&cmd.helpFlag, "help", false, "print help 
message") 
flag.BoolVar(&cmd.helpFlag, "?", false, "print help 
message") 
flag.BoolVar(&cmd.versionFlag, "version", false, "print 
version and exit") 
flag.StringVar(&cmd.cpOption, "classpath", "" 
"classpath") 
flag.StringVar(&cmd.cpOption, "cp", "", "classpath") 
flag.Parse() 
args := flag.Args() 
If len(args) > 0 
cmd.class = args[0] 
cmd.args = args[1:] 


return cmd 


首先 设置 flag.Usage 变 量 ， 把 printUsage () 
函数 赋值 给 它 ; 然后 ee 是 提供 的 各 种 Var 
() 画 数 设置 需要 解析 的 选项 ， 接 着 调用 Parse 
WU 男 数 解 析 选 项 。 如 果 Parse () 函数 解析 失 
败 ， 它 束 调 用 printUsage () 函数 把 命令 的 用 法 打 
印 到 控制 台 。printUsage () 函数 的 代码 如 下 : 


func printUsage() { 
fmt.Printf("Usage: %s [-options] class [args...]\n", 


os.Args[0]) 
} 


如 果 解 析 成 功 ， 调 用 flag.Args () 画 数 可 以 
捕获 其 他 没有 被 解析 的 参数 。 其 中 第 一 个 参数 就 
是 主 类 名 ， 剩 下 的 是 要 传递 给 主 类 的 参数 。 这 
样 ， 用 了 不 到 40 行 代码 ， 我 们 的 命令 行 工具 就 编 
写 完 了 。 下 面 来 测试 它 。 


[1] Go 源 文 件 一 般 以 .go 作为 后 级 ， 文 件 名 全 部 小 
写 ， 多 个 单词 之 间 用 下 划 线 分 隔 。Go 语 言 规范 要 
求 Go 产 文件 必须 使 用 UTF-8 编 码 ， 详 见 
https://golang.org/ref/spec ° 

[2] 笔者 推荐 Sublime2 ， 主 页 为 
http:/www.Sublimetext.com/。 

[3] Go 语言 有 函数 (Function) 和 方法 (Method) 
之 分 ,方法 调用 需要 receiver， 芳 数 调用 则 不 需 


1.4 测试 本 章 代 码 


在 ch01 目 录 下 创建 main.go 文 件 ， 然 后 输入 下 
面 的 代码 。 


package main 
import "fmt" 
func main() { 
cmd := parseCmd() 
if cmd.versionFlag { 
fmt.Printin("version 0.0.1") 
} else if cmd.helpFlag || cmd.class == "" { 
printUsage() 
} else 
startJVM(cmd) 


注意 ， 与 cmd.go 文 件 一 样 ，main.go 文 件 的 包 
名 也 是 main。 在 Go 语言 中 ，main 古 一 个 特殊 的 
包 ， 这 个 包 所 在 的 目录 (可 以 叫 作 任何 名 字 ) 会 
被 编译 为 可 执行 文件 。Go 程 序 的 入 口 也 是 main 


() 轴 数 ， 但 是 不 接收 任何 参数 ， 也 不 能 有 返回 
值 。 


main () 画 数 先 调 用 ParseCommand () 画 数 

解析 命令 行 参数 ， 如 果 一 切 正常 ， 则 调用 starUJVM 

() 函数 启动 Java 虚 拟 机 。 如 果 解 析出 现 错误 ， 或 
者 用 户 输 入 了 -help 选 项 ， 则 调用 PrintUsage () 男 
数 打印 出 帮助 信息 。 如 果 用 户 输入 了 -version 选 
项 ， 则 输出 〈 一 个 揭 等 充 数 的 ) 版 本 信息 。 因 为 
我 们 还 没有 真正 开始 编写 Java 虚 拟 机 ， 所 以 
startJVM () 画 数 暂 时 只 是 打印 一 些 信息 而 已 ， 代 
码 如 下 : 


func startJVM(cmd *Cmd) { 
fmt.Printf("classpath:%s class:%s args:%v\n", 
cmd.cpOption, cmd.class, cmd.args) 
} 


打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 章 


go install jvmgoxNxcho1 


命令 执行 完毕 后 ， 如 末 没 有 看 到 任何 输出 就 
证 明 编 译 成 功 了 ， 此 时 在 D: \govworkspacevbin 目 
录 下 会 出 现 ch01.exe 文 件 。 现 在 ， 可 以 用 各 种 参数 
进行 测试 。 笔 者 的 测试 结果 如 图 1-5 所 示 。 


D:\go\workspace\bin>ch01. exe -help 
Usage: ch0l. exe [-options] class [args...] 


D:\go\workspace\bin>ch0l1, exe -version 
version 0.0. 1 


D:\go\workspace\bin>ch01. exe -cp foo/bar yApp argl arg2 
classpath:foo/bar class:JyApp args:[argl arg2] 


图 1-5 ”ch01.exe 测 斌 结果 


1.5 ”本章 小 结 


本 章 准 备 好 了 开发 环境 ， 学 习 了 了 java 命令 的 
基本 用 法 ， 并 且 编 写 了 一 个 人 向 化 版 的 命令 行 工 
具 。 虽 然 还 没有 正式 开始 编写 Java 虚 拟 机 ， 但 是 
已 经 打 好 了 坚实 的 基础 。 下 一 章 将 深入 了 解 - 
classpath 先 项， 探讨 Java 虚 拟 机 从 哪里 寻找 class 文 
件 ， 并 实现 class 文 件 加 载 功能 。 


庆生 


第 2 章 ”搜索 class 文 件 


第 1 草 介 绍 了 java 命 令 的 用 法 以 及 它 如 何 局 动 
Java 应 用 程序 ， 首先 启动 Java 虚 拟 机 ， 然 后 加 载 主 
类 ， 最 后 调用 主 类 的 main () 方法 。 但 是 我 们 知 
道 ， 即 使 是 最 简单 的 *Hello，World” 程 序 ， 也 是 
无 法 独自 运行 的 ， 该 程序 的 代码 如 下 : 


public class Helloworld { 
public static void main(String[] args) { 
System.out.println("Hello, world!"); 
} 
} 


加 载 HelloWorld 类 之 前 ， 首 先 要 加 载 它 的 超 
类 ， 也 束 古 java.lang.Object。 在 调用 main () 方法 
之 有 前， 因为 虚拟 机 需要 准备 好 参数 数组 ， 所 以 需 
要 加 载 java.lang.String 和 java.lang.String[] 类 。 把 字 


从 串 打印 到 控制 台 还 需要 加 载 java.lang.System 
类 ， 等 等 。 那 么 ，Java 虚 拟 机 从 哪里 寻找 这 些 类 
呢 ? 本 章 将 详细 讨论 这 个 问题 。 


2.1 类 路 任 


Java 虚 拟 机 规范 并 没有 规定 虚拟 机 应 该 从 哪 
里 寻找 类 ， 因 此 不 同 的 虚拟 机 实现 可 以 采用 不 同 
的 方法 。Oracle 时 Java 虚 拟 机 实现 根据 类 路 径 
(class path) 来 搜索 类 。 按 照 搜 索 的 先后 顺序 ， 
类 路 径 可 以 分 为 以 下 3 个 部 分 : 


:启动 类 路 径 (bootstrap classpath ) 
-扩展 类 路 径 (extension classpath) 
:用户 类 路 径 (user classpath) 


启动 类 路 径 默认 对 应 jrelib 目 录 ，Java 标 准 库 
(大 部 分 在 rt.jar 里 ) 位 于 该 路 径 。 扩 展 类 路 径 默 
认 对 应 jrelibvext 目 未 ， 使 用 Java 扩 展 机 制 的 类 位 


于 这 个 路 径 。 我 们 目 己 实现 的 类 ， 以 及 第 二 方 类 
库 则 位 于 用 户 类 路 径 。 可 以 通过 -Xbootclasspath 远 
项 修改 启动 类 路 径 ， 不 过 通 遂 并 不 需要 这 样 做 ， 
所 以 这 里 吏 不 详细 介绍 了 。 


用 户 类 路 径 的 默认 值 是 当前 目录 ， 世 束 
是 “.”。 可 以 设置 CLASSPATH 环 境 变量 来 修改 用 
户 类 路 径 ， 但 是 这 样 做 不 够 灵活 ， 所 以 不 推荐 使 
用 。 更 好 的 办 法 是 给 java 命 令 传递 -classpath (或 
简写 为 -cp) 选项 。-classpath/-cp 选 项 的 优先 级 更 
高 ， 可 以 覆盖 CLASSPATH 环 境 变 量 设 置 。 第 1 章 
人 简单 介绍 过 这 个 选项 ， 这 里 再 详细 解释 一 下 。 


-classpath/-cp 选 项 既 可 以 指定 目 示 ， 也 可 以 指 
定 JAR 文 件 或 者 ZIP 文 件 ， 如 下 : 


java -cp path\to\classes ... 
Java -cp path\to\libi1.jar ... 
Java -cp path\to\lib2.zip ... 


还 可 以 同时 指定 多 个 目录 或 文件 ， 用 分 隔 符 
分 开 即 可 。 分 隔 符 因 操 作 系统 而 异 。 在 Windows 
系统 下 是 分 号 ， 在 类 UNIX (包括 Linux、Mac OS 
X 等 ) 系统 下 是 冒号 。 例 如 在 Windows 下 : 


Java -cp path\to\classes;lib\a.jar;lib\b.jar;lib\c.zip ... 


从 Java 6 开始 ， 还 可 以 使 用 通配符 (*) 指定 
某 个 目录 下 的 所 有 JAR 文 件 ， 格 式 如 下 : 


Java -cp classes;lib\* ... 


2.2 ”准备 工作 


从 第 2 草 开 始 ， 每 章 的 代码 都 是 建立 在 前 一 章 
的 基础 之 上 。 把 ch01 目 永 复制 一 份 ， 然 后 改名 为 
ch02。 因 为 本 章 要 创建 的 源 文 件 都 在 classpath 包 
中 ， 所 以 在 ch02 目 孙 中 创 建 一 个 classpath 子 目 
杂 。 现 在 目录 结构 看 起 来 应 该 是 这 样 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 
| -cho2 
|-classpath 
|-cmd.go 
|-main.go 


我 们 的 Java 庶 拟 机 将 使 用 JDK 的 局 动 尖 路 径 
来 寻找 和 加 载 Java 标 准 库 中 的 类 ， 因 此 需要 茶 种 
方式 指定 jre 目 永 的 位 置 。 谷 令 行 选项 是 个 不 铺 的 


选择 ， 所 以 增加 一 个 非 标准 选项 -Xjre。 打 开 
ch02\cmd.go， 修 改 Cmd 结 构 体 ， 添 加 XjreOption 
字段 ， 代 码 如 下 : 


type Cmd struct { 


helpFlag bool 
versionFlag bool 
cpOption string 
Xjreoption string 
class string 
args [jstring 
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parseCmd () 芳 数 也 要 相应 修改 ， 代 码 如 
下 : 


func parseCmd() *Cmd { 
cmd := &Cmd{} 
flag.Usage = printUsage 


flag.BoolVar(&cmd.helpFlag, "help", false, "print help 


message") 
flag.BoolVar(&cmd.helpFlag, "?", false, "print help 
message") 


flag.BoolVar(&cmd .versionFlag, "version", false, "print 


version and exit") 

flag.StringVar(&cmd.cpOption, "classpath", ™", 
"classpath") 

flag.SstringVar(&cmd.cpOption, "cp", "", "classpath") 

flag.StringVar(&cmd.XjreOption, "Xjre", "", "path to 
jre") 

flag.Parse() 


. // 其 他 代码 不 变 


2.3 ”实现 类 路 径 


可 以 把 类 路 径 想 象 成 一 个 大 的 整体 ， 它 由 启 
动 类 路 径 、 扩 展 类 路 径 和 用 户 类 路 径 三 个 小 路 径 
构成 。 三 个 小 路 径 又 分 别 由 更 小 的 路 径 构 成 。 是 
不 是 很 像 组 合 模式 (composite pattern) ? 没 错 ， 
本 节 就 套用 组 合 模式 来 设计 和 实现 类 路 径 。 


2.3.1 Entry 接口 


完 定义 一 个 接口 来 表示 类 路 任 项 。 在 
ch02\classpath 目 孙 下 创建 entry.go 文 件 ， 在 其 中 定 
义 Entry 接 口 ， 代 码 如 下 : 


package classpath 
import "os" 
import "strings" 
const pathListSeparator = string(os.PathListSeparator) 
type Entry interface { 
readcCclass(className string) ([J]byte, Entry, error) 
String() string 


func newEntry(path string) Entry {...} 


常量 pathListSeparator 是 string 类 型 ， 存 放 路 任 
分 隔 符 ， 后 面 会 用 到 。Entry 接 口中 有 两 个 方法 。 
readClass () 方法 负责 寻找 和 加 载 class 文 件 ; 
String () 方法 的 作用 相当 于 Java 中 的 toString 
W ， 用 于 返回 变量 的 字符 串 表 示 。 


readClass () 方法 的 参数 是 class 文 件 的 相对 
路 径 ， 路 径 之 间 用 和 斜 线 WV) 分 隔 ， 文 件 名 有 .class 
后 级 。 比 如 要 读 取 java.lang.Object 类 ， 传 入 的 参数 
应 该 是 java/lang/Object.class。 返回 值 是 读 取 到 的 
字 太 数据 、 最 终 定位 到 class 文 件 的 Entry， 以 及 销 
误 信 息 。Go 的 函数 或 方法 人 允许 返回 多 个 值 ， 按 照 
惯例 ， 可 以 使 用 最 后 一 个 返回 值 作为 错误 信息 。 


newEntry () 函数 根据 参数 创建 不 同类 型 的 
Entry 实 例 ， 代 人 码 如 下 : 


func newEntry(path string) Entry { 
if strings.Contains(path, pathListSeparator) { 
return newCompositeEntry(path ) 
} 
If strings.HasSuffix(path, "*") { 
return newwildcardEntry(path ) 


if strings.HasSuffix(path, ".jar") || 
strings.HasSuffix(path, ".JAR") || 
strings.HasSuffix(path, ".zip") | 
strings.HasSuffix(path, ".ZIP") { 
return newZzipEntry(path ) 


return newDirEntry(path ) 


Entry 接 口 有 4 个 实现 ， 分 别 是 DirEntry、 
ZipEntry、CompositeEntry 和 WildcardEntry。 下面 


分 别 介绍 每 一 种 实现 。 


2.3.2 DirEntry 


在 4 种 实现 中 ，DirEntry 相 对 简单 一 些 ， 表 示 
目录 形式 的 类 路 径 。 在 ch02\classpath 目 了 永 下 创建 
entry_dir.go 文 件 ， 在 其 中 定义 DirEntry 结 构 体 ， 代 
代 如 下 : 


package classpath 
import "io/ioutil" 
import "path/filepath" 
type DirEntry struct { 
absDir string 


func newDirEntry(path string) *DirEntry {...} 

func (self *DirEntry) readClass(className string) ([]jbyte ， 
Entry, error) {...} 

func (self *DirEntry) String() string {...} 


DirEntry 只 有 一 个 字段 ， 用 于 存放 目 孙 的 绝对 
路 径 。 和 Java 语 言 不 同 ，Go 结 构 体 不 需要 显示 实 
现 接口 ， 只 要 方法 匹配 即 可 。Go 没 有 专门 的 构造 


函数 ， 本 书 统一 使 用 new 开 头 的 函数 来 创建 结构 
体 实 例 ， 并 把 这 类 画 数 称 为 构造 画 数 。 
newDirEntry () 图 数 的 代码 如 下 : 


func newDirEntry(path string) *DirEntry { 
absDir, err := filepath.Abs(path) 
if err != nil { 
panic(err) 


} 
return &DirEntry{absDir} 
} 


newDirEntry () 先 把 参数 转换 成 绝对 路 径 ， 
如 果 和 转换 过 程 出 现 错误 ， 则 调用 panic () 函数 终 
止 程序 执行 ， 否 则 创建 DirEntry 实 例 并 人 返回。 


下 面 介绍 readClass () 方法 : 


func (self *DirEntry) readClass(className string) ([]jbyte， 
Entry, error) { 

fileName := filepath.Join(self.absDir, className) 

data, err := ioutil.ReadFile(fileName) 

return data, self, err 


readClass () 先 把 目录 和 class 文 件 名 拼 成 一 
个 完整 的 路 人 径 ， 然 后 调用 ioutil 包 提供 的 ReadFile 
() 函数 读 取 class 文 件 内 容 ， 最 后 返回 。String 
() 方法 很 简单 ， 直 接 返 回 目 录 ， 代 人 码 如 下 : 
func (self *DirEntry) String() string { 


return self.absDir 


2.3.3 ZipEntry 


ZipEntry 表 示 ZIP 或 JAR 文 件 形式 的 类 路 径 。 
在 ch02\classpath 目 录 下 创建 entry_zip.go 文 件 ， 在 
其 中 定义 ZipEntry 结 构 体 ， 代 码 如 下 : 


package classpath 

import "archive/zip" 

import "errors" 

import "io/ioutil" 

import "path/filepath" 

type ZipEntry struct { 
absPath string 


func newZipEntry(path string) *ZipEntry {...} 

func (self *ZipEntry) readcClass(className string) ([]jbyte， 
Entry, error) {...} 

func (self *ZipEntry) String() string {...} 


absPath 字 上 段 存放 ZIP 或 JAR 文 件 的 绝对 路 人 径 。 
构造 函数 和 String () 与 DirEntry 大 同 小 异 ， 就 不 
多 解释 了 ， 代 码 如 下 : 


func newZipEntry(path String) *ZipEntry { 
absPath, err := filepath.Abs(path) 
if err != nil { 
panic(err) 


return &ZipEntry{absPath} 


} 
func (self *ZipEntry) String() string { 
return self.absPath 


} 


下 面 重点 介绍 如 何 从 ZIP 文 件 中 提取 class 文 
件 ， 代 码 如 下 : 


func (self *ZipEntry) readClass(className string) ([]jbyte， 
Entry, error) { 


r, err := zip.OpenReader(self.absPath) 
if err != nil { 
return nil, nil, err 
} 
defer r.Closel() 
for _, f := range r.File { 
If f.Name == className { 
rc, err := f.Open() 
if err != nil { 
return nil, nil, err 
} 
defer rc.closel() 
data, err := ioutil.ReadAll(rc) 
if err != nil { 
return nil, nil, err 
} 
return data, self, nil 
} 
} 
return nil, nil, errors.New("class not found: ”十 
className) 


, 


目 完 打开 ZIP 文 件 ， 如 果 这 一 步 出 错 的 话 ， 直 
接 返 回 。 然 后 遍历 ZIP 压 缩 包 里 的 文件 ， 看 能 否 找 
到 class 文 件 。 如 采 能 找到 ， 则 打开 class 文 件 ， 把 
内 容 读 取出 来 ， 并 返回。 如 末 找 不 到 ， 或 者 出 现 
其 他 错误 ， 则 返回 第 误 信息 。 有 两 处 使 用 了 defer 
语句 来 确保 打开 的 文件 得 以 关闭 。readClass () 
方法 每 次 都 要 打开 和 关闭 ZIP 文 件 ， 因 此 效率 不 是 

民 高 。 笔 者 进行 了 优化 ， 但 鉴于 篇 幅 有 限 ， 驳 不 
展示 上 基体 代码 了 。 感 兴趣 的 该 着 可 以 阅读 
ch02\classpath\entry_zip2.go 文 件 。 


2.3.4 CompositeEntry 


在 ch02\classpath 目 孙 下 创建 
entry_composite.go 文 件 ， 在 其 中 定义 
CompositeEntry 结 构 体 ， 代 码 如 下 : 


package classpath 

import "errors" 

import "strings" 

type CompositeEntry []Entry 

func newCompositeEntry(pathList string) CompositeEntry {...} 
func (self CompositeEntry) readClass(className string) 


([Jbyte, Entry, error) {...} 
func (self CompositeEntry) String() string {...} 


如 前 所 述 ，CompositeEntry 由 更 小 的 Entry 组 
成 ， 正 好 可 以 表示 成 [JEntry。 在 Go 语言 中 ， 数 组 
属于 比较 低层 的 数据 结构 ， 很 少 直 接 使 用 。 大 部 
分 情况 下 ， 使 用 更 便利 的 slice 类 型 。 构 阁 玉 数 把 
参数 〈 路 径 列 表 ) 按 分 隔 符 分 成 小 路 笃 ， 然 后 把 


每 个 小 路 径 部 转换 成 具体 的 Entry 实 例 ， 代 码 如 
下 


func newCompositeEntry(pathList string) CompositeEntry { 
compositeEntry := [J]JEntry{} 
for _, path := range strings.Split(pathList, 
pathListSeparator) { 
entry := newEntry(path) 
compositeEntry = append(compositeEntry, entry) 


return compositeEntry 


} 


相信 读者 已 经 想到 readClass () 方法 的 代码 
了 : 依次 调用 每 一 个 子路 径 的 readClass () 方 

如 果 成 功 读 取 到 class 数 据 ， 返 回 数 据 即 可 ; 
如 果 收 到 错误 信息 ， 则 继续 ， 如 果 遍 历 完 所 有 的 
子路 径 还 没有 找到 class 文 件 ， 则 返回 错误 。 
readClass () 方法 的 代码 如 下 : 


func (self CompositeEntry) readClass(className string) 
([Jbyte, Entry, error) { 
for _, entry := range self { 
data, from, err := entry.readClass(classNanme) 
If err == nil { 


return data, from, nil 


return nil, nil, errors.New("class not found: ”十 
className) 


String () 方法 也 不 复杂 。 调 用 每 一 个 子路 径 
的 String () 方法 ， 然 后 把 得 到 的 字符 串 用 路 径 分 
隔 符 拼 接 起 来 即 可 ， 代 码 如 下 : 


func (self CompositeEntry) String() String { 
strs := make([]string, len(self)) 
for i, entry := range self { 
strs[i] = entry.String() 


return strings.Join(strs, pathListSeparator) 


2.3.5 WildcardEntry 


WildcardEntry 实 际 上 也 是 CompositeEntry， 所 
以 束 不 再 定义 新 的 类 型 了 。 在 ch02\classpath 目 也 
下 创建 entry_wildcard.go 文 件 ， 在 其 中 定义 
newWildcardEntry \) 芳 数 ， 代 码 如 下 : 


package classpath 
import "os" 
import "path/filepath" 
import "strings" 
func newwildcardEntry(path string) CompositeEntry { 
baseDir := path[:len(path)-1] // remove * 
compositeEntry := [J]Entry{} 
walkFn := func(path string, info os.FileInfo, err error) 
error {...} 
filepath.walk(baseDir, walkFn) 
return compositeEntry 


有 


首 爷 把 路 径 末 尾 隐 星 号 去 择 ， 得 到 baseDir， 
然后 调用 flepath 包 的 Walk () 函数 遍历 baseDir 创 
建 ZipEntry。Walk () 画 数 的 第 二 个 参数 也 是 一 


函数 ， 了 解 函 数 式 编程 的 读者 应 该 一 眼 怠 可 以 
认 出 这 种 用 法 〈 即 函数 可 作为 参数 ) 。walkFn 变 
量 的 定义 如 下 : 


walkFn := func(path string, info os.FileInfo, err error) 
error { 
if err != nil { 


return err 


if info.IsDir() && path != baseDir { 
return filepath.SkipDir 


} 
If strings.HasSuffix(path, ".jar") || 
strings.HasSuffix(path, ".JAR") { 
jarEntry := newZipEntry(path) 
compositeEntry = append(compositeEntry, jarEntry) 


return nil 


} 


在 walkFn 中 ， 根 据 后 级 名 选 出 JAR 文 件 ， 并 
日 返回 SkipDir 跳 过 子 目录 (通配符 类 路 人 径 不 能 递 
归 匹 配子 目录 下 的 JAR 文 件 ) 。 


2.3.6 Classpath 


Entry 接 口 和 4 个 实现 介绍 完了 ， 拉 下 来 实现 
Classpath 结 构 体 。 还 是 在 ch02\classpath 目 孙 下 创 
建 classpath.go 文 件 ， 把 下 面 的 代码 输入 进去 。 


package classpath 

import "os" 

import "path/filepath" 

type Classpath struct { 
bootClasspath Entry 
extClasspath Entry 
userClasspath Entry 


func Parse(jreOption, cpOption string) *Classpath {...} 
func (self *Classpath) ReadClass(className string) ([]jbyte， 
Entry, error) {...} 

func (self *Classpath) String() string {...} 


Classpath 结 构 体 有 三 个 了 字段， 分别 存放 三 种 
类 路 径 。Parse () 函数 使 用 -Xjre 人 选项 解析 局 动 类 
路 径 和 扩展 类 路 径 ， 使 用 -classpath/-cp 选 项 解析 用 
户 类 路 径 ， 人 代码 如 下 : 


func Parse(jreOption, cpOption string) *Classpath { 
cp := &Classpathf{} 
cph.parseBootAndExtCclasspath(jreOoption) 
cph.parseUserClasspath(cpOption) 
return cp 


} 


parseBootAndExtClasspath () 方法 的 代码 如 
下 : 


func (self *Classpath) parseBootAndExtClasspath(jreOption 
string) { 
JreDir := getJreDir(jreOption) 
// jre/lib/* 
jreLibPath := filepath.Join(jreDir, "lib", "*") 
self.bootClasspath = newwildcardEntry(jreLibPath) 
// jre/lib/ext/* 
JreExtPath := filepath.Join(jreDir, "lib", "ext", "*") 
self.extClasspath = newwildcardEntry(jreExtpath) 


优先 使 用 用 户 输入 的 -Xjre 选 项 作为 jre 目 录 。 
如 果 没 有 输入 该 选项 ， 则 在 当前 目录 下 寻找 jre 目 
录 。 如 采 找 不 到 ， 笑 试 使 用 JAVA_HOME 环 境 变 
量 。getJreDir () 玉 数 的 代码 如 下 : 


func getJreDir(jreoption string) string { 
if jreOption != "" && exists(jreOption) { 
return jreOption 
} 
If exists("./jre") { 
return "./jre" 
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if jh := os.Getenv("JAVA HOME"); jh != "" { 
return filepath.Join(jh, "jre") 

} 


panic("Can not find jre folder!") 


exists () 函数 用 于 判断 目录 是 否 存 在 ， 代 码 
,a 


func exists(path string) bool { 
if _, err := os.Stat(path); err != nil { 
If os.IsNotExist(err) { 
return false 
} 
} 


return true 


parseUserClasspath () 方法 的 代码 相对 简单 
一 些 ， 如 下 : 


func (self *Classpath) parseUserClasspath(cpOption string) { 
If cpOption == "™ { 
CpOption = "." 


} 
self.userClasspath = newEntry(cpOption) 
} 


如 果 用 户 没 有 提供 -classpath/-cp 选 项 ， 则 使 用 
当前 目录 作为 用 户 类 路 径 。ReadClass () 方法 依 
次 从 局 动 闫 路径、 扩展 类 路 径 和 用 户 类 路 径 中 搜 
索 class 文 件 ， 代 人 码 如 下 : 


func (self *Classpath) ReadClass(className string) ([]jbyte， 
Entry, error) { 
className = className + ".class" 
if data, entry, err := 
self.bootClasspath.readClass(className); err == nil { 
return data, entry, err 


if data, entry, err := 
self.extClasspath.readClass(className); err == nil { 
return data, entry, err 


return self.userClasspath.readClass(className) 


} 


注意 ， 传 递 给 ReadClass () 方法 的 类 名 不 包 
合 “.class” 后 级 。 最 后 ，String () 方法 返回 用 户 类 
路 任 的 字符 串 表 示 ， 代 码 如 下 : 


func (self *Classpath) String() String { 
return Self,userClasspath.String() 


} 


至 此 ， 整 个 类 路 径 都 实现 了 ， 下 面 我 们 来 测 
试 一 下 。 


2.4 测试 本 章 代 码 


打开 ch02/main.go 文 件 ， 添 加 两 条 import 语 
句 ， 代 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/ch02/classpath" 
func main() {...} 

func startJVM(cmd *Cmd) {...} 


main () 函数 不 用 变 ， 重 写 starUJVM () 男 
数 ， 代 但 如 下 : 


func startJVM(cmd *Cmd) { 
cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
fmt.Printf("classpath:%v class:%v args:%v\n", 
cp, cmd.class, cmd.args) 


className := strings.Replace(cmd.class, ".", "/", -1) 
classData, _, err := cp.Readclass(className) 
if err != nil { 
fmt.Printf("Could not find or load main class %s\n", 
cmd.class) 
return 


fmt.Printf("class data:%v\n", classData) 


} 


startJVM () 先 打 印 出 命令 行 参数 ， 然 后 读 取 
主 类 数据 ， 并 打印 到 控制 全。 里 然 还 十 无 法 真正 
局 动 Java 虚 拟 机 ， 不 过 相 比 第 1 草 ， 已 经 有 了 很 大 
的 进步 。 打 开 命 令 行 窗口 ， 执 行 下 面 的 命令 编译 
本 章 代 人 码 。 


go install jvmgo\ch02 


编译 成 功 后 ， 在 D: \govworkspace\bin 目 录 下 
出 现 ch02.exe 文 件 。 执 行 ch02.exe， 指 有 是 好 -Xjre 远 
项 和 类 名 ， 就 可 以 把 class 文 件 的 内 容 打印 出 来 。 
虽然 只 是 一 扒 看 似 杂乱 无 章 的 数字 ， 但 成 承 感 还 
是 会 油 然 而 生 。 笔 者 的 测试 结果 如 图 2-1 所 示 。 


人 


\workspace\bin c ' java. s. Object ar 
54 186 190 0 83015666380168038804210 


3 40 41 1020404176 106 9 8 {27 108 97 110 103 47 79 98 106 101 99 1 
16 59 1 0 20 40 41 76 106 97 1 r 116 114 105 110 103 
59 1 0 3 40 41 86 让 21 40 734 06 97 8 97 : 7 110 10: 3 
) 21 40 76 106 9 
102l1 4076 106 97 118 9 
7 47 108 97 110 103 47 8 83 116 114 105 110 103 59 41 86 108 60 99 108 10 


图 2-1 ”ch02.exe 的 测试 结 


2.5 本章 小 结 


本 章 讨 论 了 Java 虚 拟 机 从 哪里 寻找 class 文 
件 ， 对 类 路 径 和 -classpath 命 令 行 选项 有 了 较为 深 
入 的 了 解 ， 并 且 把 抽象 的 类 路 径 概念 转变 成 了 有 具 
体 的 代码 。 下 一 章 将 研究 class 文 件 格 式 ， 实 现 
class 文 件 解 析 。 


第 3 章 ”解析 class 文 件 


第 2 草 介 绍 了 Java 虚 拟 机 从 哪里 搜索 class 文 
件 ， 并 且 实 现 了 类 路 径 功能 ， 已 经 可 以 把 class 文 
件 读 取 到 内 存 中 。 本 章 将 详细 讨论 class 文 件 格 
式 ， 编 写 代码 解 析 class 文 件 ， 为 下 一 步 真 正 实现 
Java 庶 拟 机 做 好 准备 。 


在 开始 阅读 本 半 之 前 ， 先 把 目 台 结构 准备 
好 。 复 制 ch02 目 录 ， 并 改名 为 ch03， 然 后 编辑 
ch03\main.go 等 文件 ， 把 import 语 句 中 的 ch02 都 改 
成 ch03 1 ， 最 后 在 ch03 目 录 中 创建 classfile 子 目 
录 。 现 在 的 目录 结构 看 起 来 应 该 如 下 所 示 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 
|-cho2 
| -ch03 


|-classfile 
|-classpath 
|-cmd.go 
|-main.go 


[1] 这 个 过 程 比较 无 趣 ， 也 容易 出 销 。 可 以 使 用 编 
辑 右 提供 的 “搜索 和 准 换 ”功能 来 完成 这 项 工作 。 


3.1 class 文 件 


作为 类 (或 者 接口 ) 书信 息 的 载体 ， 每 个 
class 文 件 都 完整 地 定义 了 一 个 类 。 为 了 使 Java 程 
序 可 以 “编写 一 次 ， 处 处 运行 ”，Java 虚 拟 机 规范 
对 class 文 件 格式 进行 了 严格 的 规定 。 但 是 另 一 方 
面 ， 对 于 从 哪里 加 载 class 文 件 ， 给 了 足够 多 的 自 
由 。 由 第 2 间 可 知 ，Java 虚 拟 机 实现 可 以 从 文件 系 
统 读 取 和 从 JAR (或 ZIP) 压缩 包 中 提取 class 文 
件 。 除 此 之 外 ， 也 可 以 通过 网 络 下 载 、 从 数据 库 
加 载 ， 甚 至 是 在 运行 中 直接 生成 class 文 件 。Java 
虚拟 机 规范 (和 本 书 ) 中 所 指 的 class 文 件 ， 并 非 
特 指 位 于 磁盘 中 的 .class 文 件 ， 而 是 泛 指 任何 格式 
符合 规范 的 class 数 据 。 


构成 class 文 件 的 基本 数据 单位 是 字 站 ， 可 以 
把 整个 class 文 件 当 成 一 个 字 市 流 来 处 理 。 稍 大 一 
些 的 数据 由 连续 多 个 字 太 构成 ， 这 些 数据 在 class 
文件 中 以 大 端 (big-endian) 方式 存储 。 为 了 描述 
class 文 件 格式 ，Java 庶 拟 机 规范 定义 了 ul1、u2 和 
u4 三 种 数据 类 型 来 表示 1、2 和 4 字 节 无 符号 整数 ， 
分 别 对 应 Go 语言 的 uint8、uint16 和 uint32 类 型 。 相 
同类 型 的 多 条 数据 一 般 按 表 (table) 的 形式 存储 
在 class 文 件 中 。 表 由 表 头 和 表 项 (item) 构成 ， 
表 头 是 u2 或 u4 整 数 。 假 设 表 头 是 n， 后 面 吏 紧 跟 关 
n 个 表 项 数据 。 


Java 庶 拟 机 规范 使 用 一 种 类 似 C 语 言 的 结构 体 
语法 来 摘 述 class 文 件 格式 。 整 个 class 文 件 航 描述 
为 一 个 ClassFile 结 构 ， 代 人 码 如 下 : 


ClassFile { 
U4 magic 


U2 minor_version， 

U2 major_version,; 

U2 constant_pool_count; 

cp_info constant_pool[constant_pool count-1]; 
U2 access_flags; 

U2 this_class; 

U2 super_class; 

U2 Interfaces_count ; 

U2 interfaces[interfaces_ count]; 
U2 fields_ count,; 

field_info fields[fields count]; 

U2 methods_count ， 

method_info methods[methods_count]; 

U2 attributes_count ; 
attribute_info attributes[attributes_count]; 


JDK 提 供 了 一 个 功能 强大 的 命令 行 工 具 
javap， 可 以 用 它 反 编译 class 文 件 。 不 过 从 控制 台 
观察 javap 的 输出 并 不 是 很 二 观 ， 因 此 笔者 用 
JavaFX 编 写 了 一 个 图 形 化 的 工具 ， 叫 作 classpy 。 
有 兴趣 的 读者 可 以 去 GitHub 网 站 ! 下 载 classpy 的 
源 代码 或 者 打包 好 的 JAR 可 执行 文件 。 后 面 的 小 
万 中 将 以 ClassFileTest 类 为 例 ， 使 用 classpy 程 序 分 
析 class 文 件 格 式 。ClassFileTest 的 代码 如 下 : 


package jvmgo,book.cho3 
public class ClassFileTest { 
public static final boolean FLAG = true; 
public static final byte BYTE = 123; 
public static final char X = 'Xx'， 
public static final short SHORT = 12345; 
public static final int INT = 123456789; 
public static final long LONG = 12345678901L; 
public static final float PI = 3.14f; 
public static final double E = 2.71828; 
public static void main(String[] args) throws 
RuntimeException { 
System.out.println("Hello, World!"); 
} 
} 


[1] 本 章 后 面 提 到 的 类 ， 如 无 特别 说 明 ， 均 泛 指 类 
或 者 接口 。 
[21] https://github.com/zxhO/classpy 。 


3.2 ”解析 class 文 件 


本 和 将 一 边 讨 论 class 文 件 格式 ， 一 边 编 写 代 
码 实 现 class 文 件 解 析 。Go 语 言 内 置 了 丰富 的 数据 
类 型 ， 非 常 适合 处 理 class 文 件 。 为 了 便于 读者 参 
考 ， 表 3-1 给 出 了 Go 和 Java 语 言 基本 数据 类 型 对 照 
关系 。 在 第 4 章 中 还 会 继续 讨论 Java 数 据 类 型 。 


表 3-1 Go 和 Java 语 言 基 本 数据 类 型 对 照 天 系 


Go 语言 类 型 Java 语言 类 型 说 明 
int8 byte 8 比特 有 符号 整数 
uint8 (别名 byte) N/A 8 比特 无 符号 整数 
int16 short 16 比特 有 符号 整数 
uint16 char 16 比特 无 符号 整数 
int32 (别名 rune) int 32 比特 有 符号 整数 
uint32 N/A 32 比特 无 符号 整数 
int64 long 64 比特 有 符号 整数 

( 续 ) 

Go 语言 类 型 Java 语言 类 型 说 明 
uint64 N/A 64 比特 无 符号 整数 
float33 float 32 比特 IEEE-754 浮 点 数 
float64 double 64 比特 IEEE-754 浮 点 数 


3.2.1 读 取 数据 


解析 class 文 件 的 第 一 步 是 从 里 面 读 取 数 据 。 
虽然 可 以 把 alass 文 件 当成 字 蔬 流 来 处 理 ， 但 是 
接 操 作 字 下 很 不 方便 ， 所 以 先 定义 一 个 结构 体 来 
帮助 读 取 数据 。 在 ch03\classfile 目 录 下 创建 
class_reader.go 文 件 ， 在 其 中 定义 ClassReader 结 构 
体 和 数据 读 取 方 法 ， 代 码 如 下 : 


package classfile 

import "encoding/binary" 

type ClassReader struct { 
data [lbyte 


func (self *ClassReader) readUint8() uint8 {...} // ul 
func (self *ClassReader) readUint16() uint16 {...} // u2 
func (self *ClassReader) readUint32() uint32 {...} // u4 
func (self *ClassReader) readUint64() uint64 {...} 

func (self *ClassReader) readUint1i6s() [J]uint16 {...} 
func (self *ClassReader) readBytes(length uint32) []byte 
{...} 


ClassReader 只 是 []byte 类 型 的 包装 而 已 。 
readUint8 () 读 取 ul 类 型 数据 ， 代 码 如 下 : 


func (self *ClassReader) readUint8() uint8 { 
val := self.data[0] 
self.data = self.datal[1:] 
return val 


} 


注意 ，ClassReader 并 没有 使 用 索引 记录 数据 
位 置 ， 而 是 使 用 Go 语言 的 reslice 语 法 跳 过 已 经 该 
取 的 数据 。readUint16 () 读 取 u2 类 型 数据 ， 代 码 
如 下 : 


func (self *ClassReader) readUint16() uint16 { 
val := binary.BigEndian.Uint16(self.data) 
self.data = self.data[2:] 
return val 


} 


Go 标准 库 encoding/binary 包 中 定义 了 一 个 变 
量 BigEndian， 正 好 可 以 从 []byte 中 解码 多 字 市 数 


据 。readUint32 () 读 取 u4 类 型 数据 ， 代 码 如 下 : 


func (self *ClassReader) readUint32() uint32 { 
val := binary.BigEndian.Uint32(self.data) 
self.data = self.data[4:] 
return val 


} 


readUint64 () 读 取 uint64 (Java 虚 拟 机 规范 
并 没有 定义 u8) 类 型 数据 ， 代 码 如 下 : 


func (self *ClassReader) readUint64() uint64 { 
val := binary.BigEndian.Uint64(self.data) 
self.data = self.data[8:] 
return val 


} 


readUint16s () 读 取 uint16 表 ， 表 的 大 小 由 开 
头 的 uint16 数 据 指出 ， 代 码 如 下 : 


func (self *ClassReader) readUint1i6s() []uint16 { 
n := self.readUint16() 
s := make([]Juint16, n) 
for i := range s { 
s[i] = self.readUint16() 


return s 


} 


局 


后 一 个 方法 是 readBytes () ， 用 于 读 取 指 
定数 量 的 字 广 ， 代 人 码 如 下 : 


func (self *ClassReader) readBytes(n uint32) [lbyte { 
bytes := self.data[:n] 
self.data = self.data[n:] 
return bytes 


} 


3.2.2 ”整体 结构 


有 了 ClassReader， 可 以 开始 解析 class 文 件 
了 。 在 ch03\classfile 目 了 永 下 创建 class_file.go 文 件 ， 
在 其 中 定义 ClassFile 结 构 体 ， 代 码 如 下 : 


package classfile 
import "fmt" 
type ClassFile struct { 


//magic uint32 
minorVersion uint16 
majorVersion uint16 
constantPool ConstantPool 
accessFlags uint16 
thisClass uint16 
superClass uint16 
interfaces [Juint16 
fields []*MemberInfo 
methods []*MemberInfo 
attributes []AttributeInfo 


ClassFile 结 构 体 如 实 反 映 了 Java 虚 拟 机 规范 定 
义 的 class 文 件 格 式 。 还 会 在 class_file.go 文 件 中 实 
现 一 系列 函数 和 方法 ， 列 举 如 下 : 


func Parse(classData [jpbyte) (cf *ClassFile, err error) 


} 


func 


(self *ClassFile) read(reader *ClassReader) {...} 


func (self *ClassFile) readAndCheckMagic(reader 
*ClassReader) {...} 


func (self 


*ClassFile) 


*ClassReader) {...} 


func (self 
func (self 
func (self 
getter 

func (self 
func (self 
getter 

func (self 
getter 

func (self 
func (self 
func (self 


*ClassFile) 
*ClassFile) 
*ClassFile) 


*ClassFile) 
*ClassFile) 


*ClassFile) 
*ClassFile) 


*ClassFile) 
*ClassFile) 


readAndCheckVersion(reader 


MinorVersion() uint16 {...} // getter 
MajorVersion() uint16 {...} // getter 
ConstantPool() ConstantPool {...} // 


AccessFlags() uint16 {...} // getter 
Fields() [lj*MemberInfo {...} // 


Methods() []*MemberInfo {...} // 
ClassName() string {...} 


SuperClassName() string {...} 
InterfaceNames() [lstring {...} 


相 比 Java 语 言 ，Go 的 访问 控制 非 党 简单: 只 


有 公开 和 私有 两 种 。 所 有 上 自 字 苹 大 写 的 类 型 、 结 
构 体 、 字 段 、 灾 量 、 函 数 、 方 法 等 痢 是 公开 的 ， 

可 供 其 他 包 使 用 。 于 字母 小 写 则 是 私有 的 ， 
在 包 内 部 使 用 。 在 本 书 的 代码 中 ， 尽 量 只 公开 必 
要 的 变量 、 有 字段、 函数 和 方法 等 。 但 是 为 了 提高 


分 已 
只 能 


代码 可 读 性 ， 所 有 的 结构 体 部 是 公开 的 ， 也 束 古 
目 子 母 是 大 写 的 。 


Parse () 函数 把 []byte 解 析 成 ClassFile 结 构 
体 ， 代 码 如 下 : 


func Parse(classData []byte) (cf *ClassFile, err error) { 
defer func() { 
if r := recover(); r != nil { 
var ok bool 
err, ok = r.(error) 


if !ok { 
err = fmt.Errorf("%v", r) 
} 
} 
}() 
cr := &ClassReader{classData} 


cf = &ClassFile{} 
cf.read(cr) 
return 


Go 语言 言 没 有 异 名 处 理 机 制 i 一 个 panic- 
recover 机 制 。read () 方法 依次 调用 其 他 方法 解 
析 class 文 件 ， 代 人 码 如 下 : 


func (self *ClassFile) read(reader *ClassReader) { 
self.readAndCheckMagic(reader) // 见 


3.2.3 
self.readAndCheckVersion(reader) // 见 


3.2.4 
self.constantPool = readConstantPool(reader) // 见 


self.accessFlags = reader.readUint16() 

self.thisClass = reader.readUint16() 

self.superClass = reader.readUint16() 

self.interfaces = reader.readUint16s() 

self.fields = readMembers(reader, self.constantPool1l) // 
见 
3.2.8 

self.methods = readMembers(reader, self.constantPool) 

self.attributes = readAttributes(reader, 
self.constantPool) // 见 


ci 
} 


() 等 6 个 方法 是 Getter 方 法 ， 把 
结构 体 的 字段 骏 和 露 给 其 他 包 使 用 。MajorVersion 
() 的 代码 如 下 : 


MajorVersion 


func (self *ClassFile) MajorVersion() uint16 { 
return self.majorVersion 


} 


和 Java 有 所 不 同 ，Go 的 Getter 方 法 不 
以 “get" 开 头 。 由 于 Getter 方 法 非 利 简单， 只 是 返 
回 字 段 而 已 ， 为 了 方 约 篇 幅 ， 后 文中 不 再 给 出 
Getter 方 法 的 代码 。ClassName () 从 常量 池 查 找 
类 名 ， 代 码 如 下 : 


func (self *ClassFile) ClassName() string { 
return self.constantPool.getClassName(self.thisClass) 


} 


SuperClassName () 从 常量 池 查 找 超 类 名 ， 


代码 如 下 : 


func (self *ClassFile) SuperClassName() string { 


if self.superClass > 0f 
return self.constantPool.getClassName(self.superClass) 


} 
return "" // 只 有 


java.1lang .0bject 没 有 超 类 


. 


InterfaceNames () 从 常量 池 碍 找 接 口 名 ， 代 
但 如 下 : 


func (self *ClassFile) InterfaceNames() [jstring { 
interfaceNames := make([]string, len(self.interfaces)) 
for i, cpIndex := range self.interfaces { 
interfaceNames[i] = 
self.constantPool.getClassName(cpIndex) 


return interfaceNames 


下 面 详细 介绍 class 文 件 的 各 个 部 分 (常量 
和 属性 表 比 较 复 杂 ， 放 到 3.3 和 3.4 方 单独 讨论 ) 。 


ee 2 


很 多 文件 格式 部 会 规定 满足 该 格式 的 文件 必 
须 以 某 几 个 固定 字 广 开头 ， 这 几 个 字 太 主要 起 标 
识 作 用 ， 叫 作 魔 数 (magic number) 。 例 如 PDF 文 
件 以 4 字 节 “%PDF” (0x25、0x50、0x44、0x46) 
开头 ，ZIP 文 件 以 2 字 节 “PK”(0x50、0x4B) 开 
头 。class 文 件 的 魔 数 是 “0xCAFEBABE”。 
readAndCheckMagic () 方法 的 代码 如 下 : 


func (self *ClassFile) readAndCheckMagic(reader *ClassReader) 


magic := reader.readUint32() 
If magic != OxCAFEBABE { 
panic("java.lang.ClassFormatError: magic!") 


Java 庶 拟 机 规范 规定 ， 如 果 加 载 的 class 文 件 不 
符合 要 求 的 格式 ，Java 虚 拟 机 实现 就 抛 出 


java.lang.ClassFormatError 异 常 。 但 是 因为 我 们 才 
刚刚 开始 编写 虚拟 机 ， 还 无 法 抛 出 寞 音 ， 所 以 午 
时 先 调用 panic 〈) 方法 终止 程序 执行 。 用 classpy 
打开 ClassFileTest.class 文 件 ， 可 以 看 到 ， 开 头 4 字 
节 确 实 是 0xCAFEBABE， 如 图 3-1 所 示 。 


ClassFileTest class X 
v ClassFileTest class 0000] EX FEBABR 00 00 00 34 00 40 Qa 00 06 00 31 09 
magic: Oxcafebabe 00101 00 32 00 33 08 00 34 OA 00 35 00 36 07 00 37 07 
0020 { ) | 
minor i 


inorVersion: 0 


[ Ea & 总 中 “ | & UL QU A UD UD | 
) 3 6F 6R 73 74 €1 6E < 2 €1 €C "75 65 03 O00 00 | 
majorVersion; 52 ] 


四 3 1 1 有 效 


3.2.4 ”版 本 号 


魔 数 之 后 是 class 文 件 的 次 版 本 号 和 主 版 本 

号 ， 都 是 u2 类 型 。 假 设 某 class 文 件 的 主 版 本 号 是 
M， 次 版 本 号 是 m， 那 么 完整 的 版 本 号 可 以 表示 
成 “M.m”* 的 形式 。 次 版 本 号 只 在 J2SE 1.2 之 前 用 
过 ， 从 1.2 开 始 基本 上 就 没什么 用 了 (都 是 0) 。 主 
版 本 号 在 J2SE 1.2 之 前 是 45， 从 1.2 开 始 ， 每 次 有 
大 的 Java 版 本 发 布 ， 都 会 加 1。 表 3-2 列 出 了 到 本 书 
写作 为 止 ， 使 用 过 的 class 文 件 版 本 号 。 


表 3-2 class 文件 版本 与 


Java 版 本 class 文件 版 本 号 Java 版 本 class 文件 版 本 号 
JDK 1.0.2 45.0 ~ 45.3 J SE 5.0 49.0 
JDK1.1 45.0 ~ 45.65535 Java SE 6 50.0 

J2SE 1.2 46.0 J SBE:'T 1.0 
J2SE1.3 47.0 J SE 8 0 

J2SE 1.4 48.0 


特定 的 Java 虚 拟 机 实现 只 能 文 持 版 本 号 在 某 个 
江 围 内 的 class 文 件 。Oracle 的 实现 是 完全 同 后 兼容 
的 ， 比 如 Java SE 8 文 持 版 本 号 为 45.0~52.0 的 class 
文件 。 如 果 版 本 号 不 在 支持 的 范围 内 ，Java 虚 拟 机 
实现 就 抛 出 java.lang.UnsupportedClassVersionError 
异常 。 我 们 参考 Java 8， 文 持 版 本 号 为 45.0~52.0 的 
class 文 件 。 如 有 果 遇 到 其 他 版 本 号 ， 暂 时 先 调用 
panic () 方法 终止 程序 执行 。 下 面 是 
readAndCheckVersion () 方法 的 代码 。 


func (self *ClassFile) readAndCheckVersion(reader 
*ClassReader) { 
self.minorVersion = reader.readUint16() 
self.majorVersion = reader.readUint16() 
Switch self.majorVersion { 


case 45: 
return 
case 46, 47, 48, 49, 50, 51, 52: 
If self.minorVersion == 0 { 
return 
} 


} 


panic("java.lang.UnsupportedClassVersionError!") 


为 笔者 使 用 JDK8 编 译 ClassFileTest 类 ， 所 以 
主 版 本 号 是 52 (0x34) ， 次 版 本 号 是 0， 如 图 3-2 
所 示 。 


ClassFileTest .class X 


v ClassFileTest.class 


000 | A FE BA BE ) 00 0034 ~ ) 06 
magic: Oxcafebabe 010| 32 00 8 00 34 OA 07 
Ye 020 | 38 03 46 4C 4] SA 01 D 
0030| 43 6F 6E 61 6E 74 65 
majorVersion: 52 0040| 00 01 01 00 04 42 59 54 45 01 00 01 42 03 00 00 
constantPoolCount- 64 D050| 00 7B 01 00 01 58 01 00 01 43 03 00 00 00 58 01 


图 3-2 ”用 classpy 观 察 版 本 号 


3.2.5 类 访问 标志 


版 本 写 之 后 是 常量 池 ， 但 是 由 于 和 常量 汇 比 较 
复杂 ， 所 以 放 到 3.3 广 介绍。 营 量 池 之 后 古 类 访问 
标志 ， 这 是 一 个 16 位 的 “bitmask”， 指 出 class 文 件 
定义 的 是 类 还 是 接口 ， 访 问 级 别 是 public 还 是 
private， 等 等 。 本 章 只 对 class 文 件 进行 初步 解析 ， 
并 不 做 完整 验证 ， 所 以 只 是 读 取 类 访问 标志 以 备 
后 用 。 第 6 划 会 评 细 讨论 访问 标志 。ClassFileTest 
的 类 访问 标志 是 0x21， 如 图 3-3 所 示 。 


ClassFileTest.class X 


constantPoolCount: 64 


图 3-3 ”用 dlasspy 观 察 类 访 问 标 志 


3.2.6 ”类 和 超 类 索引 


拓 访 问 标 志 之 后 是 两 个 u2 类 型 的 利 量 池 系 

引 ， 分 别 给 出 类 名 和 超 类 名 。class 文 件 存储 的 类 
名 类 似 完 全 限定 名 ， 但 是 把 点 换 成 了 和 斜 线 ，Java 语 
言 规范 把 这 种 名 字 叫 作 二 进 制 名 (binary 

names) 。 因 为 每 个 类 都 有 名 字 ， 所 以 thisClass 必 
须 征 有 效 的 向量 池 索 3 引 。 除 java.lang.Object 之 外 ， 
其 他 类 都 有 超 类 ， 所 以 superClass 只 在 Object.class 
中 是 0， 在 其 他 class 文 件 中 必须 是 有 效 的 弟 量 字 索 
引 。 如 图 3-4 所 示 ，ClassFileTest 的 类 索引 是 5， 超 


类 索引 是 6。 


ClassFileTest class xX 
pb constantPoo]| wei 5 
accessFlags: ACC_PUBLIC ACC_SUPER 2 i A 全 2 Er 
J260| 6E 67 38 29 56 00 21 BGS 00 06 
superClass: #6->java/lang/Object 9270| 19 00 07 00 08 00 01 00 09 00 00 
?791l 0 OB OU OC OO D1 OO Ou OV UD 


interfaceSsCount 0 


图 3-4 ”用 classpy 观 察 类 和 超 关 索引 


3.2.7 ”接口 索引 表 


类 和 超 类 索引 后 面 古 接口 索引 表 ， 表 中 存放 
的 也 是 第 量 池 索 引 ， 给 出 该 类 实现 的 所 有 接口 的 
名 字 。ClassFileTest 没 有 实现 接口 ， 所 以 接口 表 走 
空 的 ， 如 图 3-5 所 示 。 


ClassFileTest.class X 


thisClass: #5=>jvmgo/boe IE <>! on Di (0 ol - 2 
3240 65 61 6D 01 00 O97 | 69 6E 74 6E 01 00 15 | 

superClass: #6->java/lant |h2s0| 28 4C €A 61 76 61 2F 6C 61 6E €7 2F 53 74 72 69 
e260 ce 67 38 29 5¢ 00 21 00 05 00 06 CONG 00 08 00 | 
rp 3270| 19 00 07 00 08 00 01 00 09 00 00 00 02 00 0a 00 | 
JzZgU lS OU OB OU DO US U0 OO OV V2Z DU UD QQ | 


fieldsCount: 8 An 


图 3-5 ”用 classpy 观 察 接口 索引 表 


3.2.8 ”字段 和 方法 表 


接口 索引 表 之 后 征 字 段 表 和 方法 表 ， 分 别 存 
储 字 段 和 方法 信息 。 字 段 和 方法 的 基本 结构 大 致 
相同 ， 老 别 仅 在 于 属性 表 。 下 面 是 Java 庶 拟 机 规范 
给 出 的 字段 结构 定义 。 


field_info { 


U2 access_flags; 

U2 name_index; 

U2 descriptor_index; 

U2 attributes_ count; 

attribute_info attributes[attributes_count ] ; 
} 


和 类 一 样 ， 字 上段 和 方法 也 有 目 己 的 访问 标 
志 。 访 问 标志 之 后 是 一 个 剃 量 池 索 引 ， 给 出 子 段 
名 或 方法 名 ， 然 后 义 古 一 个 第 量 池 索 引 ， 给 出 字 
段 或 方法 的 朱 述 符 ， 最 后 羡 属 性 和 。 为 了 避免 重 
复 代 码 ， 用 一 个 结构 体 统一 表示 字段 和 方法 。 在 


ch03\classfile 目 条 中 创建 member_info.go 文 件 ， 在 
其 中 定义 MemberInfo 结 构 体 ， 代 码 如 下 : 


package classfile 
type MemberInfo struct { 


cp ConstantPool 
accessFlags uint16 
nameIndex uint16 
descriptorIndex uint16 
attributes []AttributeInfo 


} 


func readMembers(reader *ClassReader, cp ConstantPool ) 
[]*MemberInfo {...} 

func readMember(reader *ClassReader, cp ConstantPool) 
*MemberInfo {...} 

func (self *MemberInfo) AccessFlags() uint16 {...} // getter 
func (self *MemberInfo) Name() string {...} 

func (self *MemberInfo) Descriptor() string {...} 


cp 字段 保存 常量 池 指 针 ， 后 面 会 用 到 它 。 
readMembers () 读 取 字段 表 或 方法 表 ， 代 码 如 
下 


func readMembers(reader *ClassReader, cp ConstantPool ) 
[]*MemberInfo { 


memberCount := reader.readUint16() 
members := make([]*MemberInfo, memberCount) 
for i := range members { 


members[i] = readMember (reader, cp) 


} 


return members 


} 


readMember () 函数 读 取 字 段 或 方法 数据 ， 
代码 如 下 : 
func readMember(reader *ClassReader, cp ConstantPool) 


*MemberInfo { 
return &MemberInfof{ 


cp: cp, 
accessFlags: reader .readUint16(), 
nameIndex: reader .readUint16(), 
descriptorIindex: reader .readUint16(), 
attributes: readAttributes(reader, cp), // 见 
3.4 
} 
} 


属性 表 和 readAttributes () 函数 将 在 3.4 节 介 
绍 。Name () 从 常量 池 查 找 字段 或 方法 名 ， 
Descriptor () 从 常量 池 查 找 字段 或 方法 描述 符 ， 
代码 如 下 : 


func (self *MemberInfo) Name() string { 
return self.cp.getUutf8(self.nameIndex) 


func (self *MemberInfo) Descriptor() string { 


return Self.cp.getUtf8(self.descriptorIndex ) 


第 6 章 会 进一步 讨论 字段 和 方法 。 
ClassFileTest 有 8 个 字段 和 两 个 方法 (其 中 <init> 是 
编译 如 生成 的 默认 构造 画 数 ) ， 如 图 3-6 和 图 3-7 所 


小 ° 


ClassFileTest class X 


Ot 


= 


interfaces 


023 caAel 76 61 2F 69 6F 2F 

fieldsCount 8 D2401 6S 61 6D 01 00 07 70 7 了 2 
0250| 28 4C 6 61 76 61 2F 6C 

ID260 ecE 67 3B 29 56 00 21 Of 

v #0: FLAG i0270] 19 00 07 00 08 00 01 00 
accessFlags: ACC_PUBLIC, ACC_STATIC, ACC_FINAL 0280| 19 00 0B 00 0c 00 01 00 
namelndex: #7->FLAG mm ,92901 19 00 0OE 00 0F 00 01 00 
Wii '02aA0| 19 00 11 00 12 00 01 00 
I02B01 19 00 14 00 15 00 01 06 

attributesCount 1 ‘02c0| 19 00 17 00 18 00 01 00 

» attributes ‘02D0| 19 00 1B 00 1ic 00 01 00 
OK IO2E0| 19 00 1E 00 1F 00 01 00 
用 了 三 六 nnn nn 233 AN 23 NA 


3-6 ”用 classpy 观 察 字 上 段 表 


mm IR ~» 


™ NDNAPN NN NN /~ 


Tields 
methodsCount 2 


19 00 17 00 18 00 01 00 09 00 
19 00 1B 00 IC 00 01 00 09 00 
19 00 1E 006 iF 00 01 00 09 00 
bp #0: <init> 
v #1: main 
accessFlags: ACC_PUBLIC, ACC_STATIC 
namelndex: #41->main 
descriptorindex: #42->([Ljava/lang/String,)v 
attribUtesCount: 2 
> attributes 
attributesCount: 1 
> attributes 


0380| 2F 00 00 00 02 00 30 


er 


图 3-7 用 classpy 观 察 方法 表 


3.3 ”解析 第 量 池 


音量 池 占 据 了 class 文 件 很 大 一 部 分 数据 ， 里 
面 存 放 看 各 式 各 样 的 弟 量 信息 ， 包 括 数 子 和 字符 
串 和 常量 、 类 和 接口 名 、 了 字段 和 方法 名 ， 竺 等 。 
万 将 详细 介绍 利 量 池 和 各 种 种 量 。 


3.3.1 ”ConstantPool 结 构 体 


在 ch03\classfile 目 如 下 创建 constant_pool.go 文 
件 ， 在 里 面 定义 ConstantPool 类 型 ， 代 码 如 下 所 


2 


package classfile 

type ConstantPool [l]ConstantInfo 

func readConstantPool(reader *ClassReader) ConstantPool {...} 
func (self ConstantPool) getConstantIinfo(index uint16) 
ConstantInfo {...} 

func (self ConstantPool) getNameAndType(index uint16) 
(string, string) {...} 

func (self ConstantPool) getClassName(index uint16) string 


{...} 
func (self ConstantPool) getUtf8(index uint16) string {...} 


音量 池 实 际 上 也 是 一 个 琢 ， 但 是 有 三 点 需要 
特别 注意 。 第 一 ， 表 头 给 出 的 第 量 池 大 小 比 实际 
大 1。 假 设 表 头 给 出 的 值 征 na， 那 么 种 量 池 的 实际 
大 小 是 n-1。 第 二 ， 有 效 的 帅 量 池 索 引 征 1~n-1。0 
征 无 效 肥 3| ， 才 示 不 指 网 任 何 利 量 。 人 第 三 ， 


CONSTANT_Long_info 和 CONSTANT_Double_info 
各 占 两 个 位 置 。 也 职 是 说 ， 如 条 和 营 量 池 中 存在 这 
两 种 音量 ， 实 际 的 音量 数量 比 n-1 还 要 少 ， 而 且 
1~n-1 的 某 些 数 也 会 变 成 无 效 索引 。 篆 量 洒 由 
readConstantPool () 函数 读 取 ， 人 代码 如 下 : 


func readConstantPool(reader *ClassReader) ConstantPool { 
cpCount := int(reader.readUint16()) 
cp := make([]ConstantInfo, cpCount) 
for i := 1; i < cpCount; i++ { // 注意 索引 从 


1 开始 


cp[il] = readConstantIinfo(reader, cp) 

Switch cp[il].(type) { 

case *ConstantLongInfo, *ConstantDoubleInfo: 
i++ // 占 两 个 位 置 


} 


return cp 


getConstantInfo () 方法 按 索引 查找 常量 ， 代 
码 如 下 : 


func (self ConstantPool) getConstantIinfo(index uint16) 
ConstantInfo { 


If cpInfo := self[index]; cpInfo != nil { 
return cpInfo 


panic("Invalid constant pool index!") 


} 


getNameAndType () 方法 从 常量 池 查 找 字 段 
或 方法 的 名 字 和 描述 符 ， 代 码 如 下 : 


func (self ConstantPool) getNameAndType(index uint16) 
(string, string) { 


ntInfo := self.getConstantInfo(index). 
(*ConstantNameAndTypeInfo ) 
name := self.getUtf8(ntInfo.nameIndex) 


_type := self.getUtf8(ntInfo.descriptorIindex) 
return name, _type 


getClassName () 方法 从 常量 池 碍 找 类 名 ， 代 
人 码 如 下 : 


func (self ConstantPool) getClassName(index uint16) string { 
classInfo := self.getConstantIinfo(index ) . 
(*ConstantClassInfo) 


return self.getuUtf8(classInfo.nameIndex ) 
} 


getUtf8 () 方法 从 常量 池 查 找 UTF-8 字 符 串 ， 


代码 如 下 : 


func (self ConstantPool) getuUtf8(index uint16) string { 
utf8Info := self.getConstantIinfo(index). 
(*ConstantUtf8Info) 
return utf8Info.str 
} 


ClassFileTest 的 汕 量 池 大 小 是 61 如 图 3-8 所 示 


ClassFileTest.class X 
I 
| v ClassFileTest.class 000| CA FE BA BE 00 00 00 34 DH 0A 00 0 


O 〇 


人 A | 6 00 31 “ 

magic: Oxcafebabe 010| 00 32 00 33 08 00 34 0A 00 35 00 36 07 00 37 07 

0201 90 38 01 00 04 46 4C 41 47 0 01 5A 01 06 0D 

minorVersion: 0 A a 与 这 

| iorversion- 0 43 6F 6E 4 61 6E 74 S56 € ~ 5 0 
majorVersion; 52 4 ) J4 42 59 54 45 0 | 42 03 0 


ConstantPool 


图 3-8 用 dasspy 观 冯 常量 池 大 小 


| constantPoolCount 64 060 00 7B 01 00 01 58 01 00 01 43 03 00 90 00 58 0 


3.3.2 ”ConstantInfo 接 口 


由 于 钊 量 池 中 存放 的 信息 各 不 相同 ， 所 以 每 
种 季 量 的 格式 也 不 同 。 第 量 效 据 的 第 一 字 世 是 
tag， 用 来 区 分 常量 类 型 。 下 面 是 Java 虚 拟 机 规范 
给 出 的 第 量 结构 。 


cp_info { 

ui1 tag ， 

UL Infof[ ] ， 
} 


Java 庶 拟 机 规范 一 共 定 义 了 14 种 常量 。 在 
ch03\classfile 目 孙 下 创建 constant_info.go 文 件 ， 在 
其 中 定义 tag 和 常量 值 ， 代 码 如 下 : 


package classfile 
// tag 常 量 值 定义 


const 
CONSTANT_Class 


Ill 
bw | 


CONSTANT_Fieldref = 9 
CONSTANT_Methodref = 10 
CONSTANT_InterfaceMethodref = 11 
CONSTANT_String = 8 
CONSTANT_Integer = 3 
CONSTANT_Float 三 才 
CONSTANT_Long 三 号 
CONSTANT_Double 三 : 昌 
CONSTANT_NameAndType = 12 
CONSTANT_Utf8 = 1 
CONSTANT_MethodHandle = 15 
CONSTANT_MethodType = 16 
CONSTANT_InvokeDynamic = 18 


继续 编辑 constant_pool.go， 定 义 ConstantInfo 
接口 来 表示 锅 量 信 息 ， 代码 如 下 : 


type ConstantInfo interface { 
readInfo(reader *ClassReader) 


: 


func readConstantIinfo(reader *ClassReader, cp ConstantPool) 
ConstantInfo {...} 

func newConstantInfo(tag uint8, cp ConstantPool) 
ConstantInfo {...} 


readInfo () 方法 读 取 常量 信息 ， 需 要 由 具体 
的 常量 结构 体 实现 。readConstantInfo () 函数 先 
读 出 tag 值 ， 然 后 调用 newConstantInfo () 函数 创 


建 具 体 的 常量 ， 最 后 调用 常量 的 readInfo () 方法 
该 取 钊 量 信息 ， 代 公 如 下 : 


func readConstantIinfo(reader *ClassReader, cp ConstantPool) 
ConstantInfo { 

tag := reader.readUint8() 

Cc := newConstantInfo(tag, cp) 

c.readIinfo(reader) 

return c 


newConstantInfo () 根据 tag 值 创建 具体 的 常 
量 ， 代 人 码 如 下 : 


func newConstantInfo(tag uint8, cp ConstantPool) 
ConstantInfo { 
switch tag { 
case CONSTANT_Integer: return &ConstantIintegerIinfo{} 
case CONSTANT_Float: return &ConstantFloatIinfo{} 
case CONSTANT_Long: return &ConstantLongInfo{} 
case CONSTANT_Double: return &ConstantDoubleInfof{} 
case CONSTANT_Utf8: return &ConstantUtf8Info{} 
case CONSTANT_String: return &ConstantStringInfo{cp: cp} 
case CONSTANT_Class: return &ConstantClassInfo{cp: cp} 
case CONSTANT_Fieldref: 
return &ConstantFieldrefIinfo{ConstantMemberrefInfo{cp: 
cp}} 
case CONSTANT_Methodref: 
return 
&ConstantMethodrefInfo{ConstantMemberrefIinfo{cp: cp}} 
case CONSTANT_InterfaceMethodref : 
return 
&ConstantIinterfaceMethodrefIinfo{ConstantMemberrefInfo{cp: 


cp}} 
case CONSTANT_NameAndType: return 


&ConstantNameAndTypeInfo{} 

case CONSTANT_MethodType: return 
&ConstantMethodTypeInfo{} 

case CONSTANT_MethodHandle: return 
&ConstantMethodHandleInfo{} 

case CONSTANT_InvokeDynamic: return 
&ConstantInvokeDynamicInfo{} 

default: panic("java.lang.ClassFormatError: constant pool 
tag!") 

} 
} 


下 面 的 小 节 详 细 介绍 各 种 营 量 。 


3.3.3 CONSTANT_Integer_info 


CONSTANT_Integer_info 使 用 4 字 节 存储 整数 
音量 ， 其 结构 定义 如 下 : 
CONSTANT_Integer_info { 
U1 tag; 
U4 bytes; 
} 
CONSTANT_Integer_info 和 后 面 将 要 介绍 的 其 
他 三 种 数字 第 量 无 论 是 结构 ， 还 是 实 更， 都 非常 
相似 ， 所 以 把 它们 定义 在 同一 个 文件 中 。 在 
ch03\classfile 目 永 下 创建 cp_numeric.go 文 件 ， 在 其 
中 定义 ConstantIntegerInfo 结 构 体 ， 代 人 码 如 下 : 


package classfile 

import "math" 

type ConstantIntegerInfo struct { 
val int32 

} 


func (self *ConstantIntegerInfo) readIinfo(reader 
*ClassReader) {...} 


readInfo () 先 读 取 一 个 uint32 数 据 ， 然 后 把 
它 转型 成 int32 类 型 ， 代 码 如 下 : 


func (self *ConstantIntegerInfo) readIinfo(reader 
*ClassReader) { 

bytes := reader.readUint32() 

self.val = int32(bytes) 
} 


CONSTANT_Integer_info 正 好 可 以 容纳 一 个 
JavaHJint 型 常量 ， 但 实际 上 比 int 更 小 的 boolean 、 
byte、short 和 和 char 类 型 的 常量 也 放 在 
CONSTANT_Integer_info 中 。 编 详 姨 给 
ClassFileTest 类 的 INT 字 段 生 成 了 一 个 


CONSTANT _Integer_info 常 量 ， 如 图 3-9 所 示 。 


ClassFileTest.class X 
bp #20 (Utf8): INT 三 


JB yi UV UL S58 Vi Ul 43 U3 UU UU UY S558 UL 


Cc | 
Cc 


U0T TI ny 
060| 00 05 53 48 4F 52 54 01 00 01 53 03 00 00 30 39 
* #21 (Utf8)- | 070] 01 00 03 49 4E 54 01 00 01 49 ESEREDEGS 01 
v #22 (Integer): 123456789 080| 00 04 4C 4F 4E 47 01 00 901 4aA 05 00 00 00 02 DF 
3 090| bc 1c 35 01 00 02 50 49 01 00 01 46 04 40 48 FS 
0a0l C3 01 00 01 45 01 00 01 44 06 40 05 BF 09 95 AA 
bytes: 123456789 nROI F7 90 NT NN NG 3c 69 fF 69 74 3F n1 NN 03 28 29 


图 3-9 用 classpy 观 察 CONSTANT_Integer_info 各 


= 
里 


3.3.4 CONSTANT Float info 


CONSTANT Float info 使 用 4 字 节 存储 


IEEE754 单 精度 浮 点 数 弟 量 ， 结 构 如 下 : 


CONSTANT_Float_info { 
U1 tag; 
U4 bytes; 


在 cp_numeric.go 文 件 中 定义 ConstantFloatInfo 
结构 体 ， 代 码 如 下 : 


type ConstantFloatInfo struct { 
val float32 


func (self *ConstantFloatIinfo) readIinfo(reader *ClassReader) 
bytes := reader.readUint32() 


self.val = math.Float32frombits(bytes) 
} 


readInfo () 先 读 取 一 个 uint32 数 据 ， 然 后 调 
用 math 包 的 Float32frombits () 函数 把 它 转换 成 
float32 类 型 。 编 译 絮 给 ClassFileTest 类 的 PI 字段 生 
成 了 一 个 CONSTANT_Float_info 常 量 ， 如 图 3-10 所 


A 


ClassFileTest.class X 


» #27 (Utf8): PI )0601 00 05 53 48 4F 52 54 01 00 01 53 03 00 00 30 39 | 
» #28 (Utf8)- F | a 人 2 Se 本 汉 LB CN 
)0801 00 04 4C 4F 4E 47 01 00 01 4A 05 00 00 00 02 DF | 

| v #29 (Float): 3.14 )0901 DC 1c 35 01 00 02 50 49 01 00 01 46 ED ES 
| tag: 4 ga C3 01 00 01 45 01 00 01 44 06 40 05 BF 09 95 AA | 
Bvte 引 半生 和 4 90 01 00 08 3C 69 6E 69 74 3E 01 00 03 28 29 | 


图 3-10 用 classpy 观 察 CONSTANT Float_info 禹 消 量 


3.3.5 CONSTANT_ Long_info 


CONSTANT _Long_info 使 用 8 字 节 存储 整数 常 
量 ， 结 构 如 下 : 


CONSTANT_Long_info { 
ui1 tag ， 
U4 high_bytes 
U4 low_ bytes; 

} 


在 cp_numeric.go 文 件 中 定义 ConstantLongInfo 
结构 体 ， 代 码 如 下 : 


type ConstantLongInfo struct { 
val int64 


func (self *ConstantLongInfo) readIinfo(reader *ClassReader) { 
bytes := reader.readUint64() 
self.val = int64(bytes) 

} 


readInfo () 先 读 取 一 个 uint64 数 据 ， 然 后 把 
它 转 型 成 int64 类 型 。 编 译 器 给 ClassFileTest 类 的 
LONG 字 上 段 生 成 了 一 个 CONSTANT_Long _info 常 
如 图 3-11 所 示 。 


ClassFileTest class X 

> #23 (Utf8): LONC i050 0D 7B 01 

» #24 (Utf8): J el i 
| 49 


)0701 01 00 03 46 00 01 49 03 07 5B cD 15 01 
08D | 00 04 4C 4F 00 01 4n EDoo000D2 ES 


tag: 5 9019D C3 01 00 02 50 49 01 00 01 46 04 40 48 FS 
】 四 C3 0 O00 O01 4 01 00 01 6 S 


hh 
》 辐 晤 梧 心 
Rn tn on 


highBytes: Ox2 A 和 
JQBO| FT7 90 0i 00 06 3C 69 6E 69 74 3E 01 00 0 时 


lowBytes: Oxdfdc1c33 )0c0| 56 01 00 04 43 6F 64 65 01 00 0F 4C 69 6E 65 4E 


图 3-11 用 classpy 观 察 CONSTANT_Long_info 常 量 


3.3.6 CONSTANT Double info 


最 后 一 个 数字 第 量 是 
CONSTANT Double info， 使 用 8 字 节 存储 
IEEE754 双 精度 浮 点 数 ， 结 构 如 下 : 


CONSTANT_Double_ info { 
ui1 tag; 
U4 high_bytes; 
U4 low_ bytes; 

} 


在 cp_numeric.go 文 件 中 定义 
ConstantDoubleInfo 结 构 体 ， 代 码 如 下 : 


type ConstantDoubleInfo struct { 
val float64 


func (self *ConstantDoubleInfo) readIinfo(reader *ClassReader) 
{ 

bytes := reader.readUint64() 

self.val = math.Float64frombits(bytes) 
} 


readInfo () 移 读 取 一 个 uint64 数 据 ， 然 后 调 
用 math 包 的 Float64frombits () 函数 把 它 转 换 成 
float64 类 型 。 编 译名 给 ClassFileTest 类 的 E 字 段 生 
成 了 一 个 CONSTANT_Double_info 常 量 ， 如 图 3-12 
所 示 。 


ClassFileTest class X 
TT 


图 3-12 用 casspy 观 察 CONSTANT Double_info 律 


加 


3.3.7 CONSTANT_ Utf8_info 


CONSTANT _Utf8_info 常 量 里 放 的 是 MUTF-8 
编码 的 字符 串 ， 结 构 如 下 : 


CONSTANT_Utf8_info { 
ui1 tag ， 
U2 length; 
ui bytes[length]; 
} 


注意 ， 字 人 符 串 在 class 文 件 中 是 以 MUTEF-8 
(Modified UTF-8) 方式 编码 的 。 但 为 什么 没有 用 
标准 的 UTF-8 编 码 方 式 ， 笔 者 没有 找到 明确 的 原 
中 。MUTF-8 编 码 方式 和 UTF-8 大 至 相同， 但 并 不 
兼容 。 差 别 有 两 点 : 一 是 null 字 符 (代码 点 
U+0000) 会 被 编码 成 2 字 节 : 0xC0、0x80; 二 是 
补充 字符 (Supplementary Characters， 代 码 点 大 于 


U+EFFFF 的 Unicode 字 符 ) 是 按 UTF-16 拆 分 为 代理 
对 (Surrogate Pair) 分 别 编码 的 。 具 体 细 廊 超出 了 
本 章 的 讨论 范围 ， 有 兴趣 的 读者 可 以 阅读 Java 虚 拟 
机 规范 和 Unicode 规 范 的 相关 章节 喇 。 


在 ch03\classfile 目 了 永 下 创建 cp_utf8.go 文 件 ， 在 
其 中 定义 ConstantUtf8Info 结 构 体 ， 代 码 如 下 : 


package classfile 

import "fmt" 

import "unicode/utf16" 

type ConstantUtf8Info struct { 
str string 


func (self *ConstantUtf8Info) readIinfo(reader *ClassReader) 


{} 


readInfo () 方法 先 读 取出 [byte， 然 后 调用 
decodeMUTF8 () 玉 数 把 它 解 码 成 Go 字符 串 ， 代 
人 码 如 下 : 


func (self *ConstantUtf8Info) readIinfo(reader *ClassReader) { 
length := uint32(reader.readUint16()) 


bytes := reader.readBytes(length) 
self.str = decodeMUTF8(bytes) 
} 


Java 序 列 化 机 制 也 使 用 了 MUTF-8 编 码 。 
java.io.DataInput 和 java.io.DataOutput 接 口 分 别 定义 
了 readUTF () 和 writeUTF () 方法 ， 可 以 读 写 
MUTF-8 编 码 的 字符 串 。decodeMUTF8 () 画 数 的 
代码 就 是 笔者 根据 java.io.DataInputStream.readUTF 

() 方法 改写 的 。 代 码 很 长 ， 解 释 起 来 也 很 乏 
味 ， 所 以 这 里 融 不 详细 解释 了 。 因 为 Go 语言 字符 
串 使 用 UTF-8 编 合 ， 所 以 如 此 字符 串 中 不 包含 null 
字符 或 促 充 字符 ， 下 面 这 个 们 化 版 的 readMUTF8 

() 也 是 可 以 工作 的 。 


// 简化 版 ,完整 版 请 阅读 本 章 源 代码 


func decodeMUTF8(bytes []jbyte) string { 
return string(bytes) 


} 


相信 细心 的 读 痢 在 剖面 的 截图 中 己 经 看 到 
了 ， 了 字段 名 、 字 上 段 拍 述 符 等 就 是 以 字符 串 的 形式 
存储 在 class 文 件 中 的 ， 如 字段 PI 对 应 的 
CONSTANT_Utf8_info 常 量 ， 如 图 3-13 所 示 。 


tag- 1 J0901 DC 1C 35 B90 01 00 O01 46 04 40 48 FS 
ength- 2 JUD c3 01 00 01 45 01 00 01 44 06 40 05 BF 09 95 AA 
B F'} - 3C 69 6E 69 14 3E 01i 00 03 28 29 


图 3-13 用 a Utf8_info 和 和 量 
这 
http://stackoverflow.com/questions/15440584/why- 
does-java-use-modified-utf-8-instead-of-utf-8 ° 

[2] 或 者 这 篇 文 章 
http:/www.oracle.com/technetwork/articles/javase/su 


pplementary-142654.html ° 


3.3.8 CONSTANT_ String_info 


CONSTANT_String_info 常 量 表示 


java.lang.String 字 耐量， 结构 如 下 : 
CONSTANT_String_info { 
ul1 tag; 


U2 string_index; 


; 


可 以 看 到 ，CONSTANT_String_info 本 身 并 不 
存放 字符 串 数 据 ， 只 存 了 第 量 池 索 引 ， 这 个 索引 
指向 一 个 CONSTANT_Utf8_info 常 量 。 在 
ch03\classfile 目 杂 下 创建 cp_string.go 文 件 ， 在 其 中 
定义 ConstantStringInfo 结 构 体 ， 代 码 如 下 : 


package classfile 

type ConstantStringInfo struct { 
cp ConstantPool 
stringIndex uint16 


} 
func (self *ConstantStringInfo) readIinfo(reader *ClassReader) 


a 
func (self *ConstantStringInfo) String() string {...} 


readInfo () 方法 读 取 常量 池 索 引 ， 代 码 如 
下 : 


func (self *ConstantStringInfo) readIinfo(reader *ClassReader) 


self.stringIndex = reader.readUint16() 


string () 方法 按 索引 从 常量 池 中 查找 字符 
串 ， 代 码 如 下 : 


func (self *ConstantStringInfo) String() String { 
return Self.cp.getUtf8(self.stringIndex ) 


ClassFileTest 的 main () 方法 使 用 了 字符 串 字 
面 量 “Hello，World! ”， 对 应 的 
CONSTANT_String_info 常 量 如 图 3-14 所 示 。 


ClassFileTest.class Xx 


I” constantPool cA FE BA BF 00 4 n 31 
b #01 (Methodref): java/lanc 1 0! 2 0 3 O80034 Oz 5 0 4 针 4 
-02 Flor javajiang/S 0 OR 放生 全 生生 人 二 让 全 全 全 人 呈 袜 全 证 
ET oso oo ol 01 oo 04 42 59 54 45 ol00 01 42 0 
tag: 8 0S50 00 7B O01 01 S58 :i 1 43 0 0 5 十 
Stringindex- 52 0601 -00 D035 23 4F 52 54 01 20 1 53 03 


图 3-14 用 classpy 观 察 CONSTANT _String_info 香 


可 以 看 到 ，string_index 是 52 (0x34) 。 我 们 
按 图 索 经 ， 从 常量 池 中 找 出 第 52 个 常量 ， 确 实 是 
个 CONSTANT Utf8 info， 如 图 3-15 所 示 。 


ClassFileTest.class X 


| UB UY U2 VU oS Td3 Yb UT 二 2 3U US Ub UV M3 Uv 


v #52 (Utf8); Hello, Worid! 
tag: 1 )190| 00 3B 00 3C BO gD a9 6 Ec EG éP i 20 S57 6 | 
length- 13 )1a0 | 72 6C 全 21 O07 00 3D OC 00 3E 00 3F 01 00 1D 6A 


1BO| 76 6D 67 2P ez 6F 6F 6B 2F 63 68 30 33 2F 43 
} 


| “ 字 令 ， 牙 六 4 ~ 


/4 2E €A 61 "16 > 3A QC 


bytes: Hello, World! TI 2 和 
1c0| Ht OS 已 二 0 辣子 ec OV VE HOY | 二 rm 10 6 


图 3-15 用 ey String_info 香 


3.3.9 CONSTANT_ Class_info 


CONSTANT_Class_info 常 量 表示 类 或 者 接口 
的 符号 3 引用， 结构 如 下 : 


CONSTANT_Class_info { 
ui1 tag; 
U2 name_index; 


; 


和 CONSTANT_String_info 类 似 ，name_index 
是 常量 池 索 引 ， 指 向 CONSTANT _Utf8_info 常 量 。 
在 ch03\classfile 目 杂 下 创建 cp_class.go 文 件 ， 在 其 
中 定义 ConstantClassInfo 结 构 体 ， 代 人 码 如 下 : 


package classfile 

type ConstantClassInfo struct { 
cp ConstantPool 
nameIndex uint16 


func (self *ConstantClassInfo) readIinfo(reader *ClassReader) 


self.nameIndex = reader.readUint16() 


} 


func (self *ConstantClassInfo) Name() string { 
return self.cp.getuUutf8(self.nameIndex) 
} 


代码 和 前 一 下 大 同 小 异 ， 吏 不 多 解释 了 。 关 
和 超 类 索引， 以 及 接口 表 中 的 接口 驼 引 指 加 的 都 
是 CONSTANT Class info 第 量 。 由 疼 3-3 可 知 ， 
ClassFileTest 的 this_class 索 引 是 5。 我 们 找到 第 5 个 
音量 ， 可 以 看 到 ， 的 确 走 
CONSTANT_Class_info。 它 的 name_index 是 55 
(0x37) ， 如 图 3-16 所 示 。 


再 看 第 55 个 剃 量 ， 也 的 确 是 
CONSTANT Utf info， 如 图 3-17 所 示 。 


ClassFileTest.class X 


nameindex 55 


图 3-16 ”用 classpy 观 察 CONSTANT_Class_info 和 


il 


ClassFileTest.class X 


0 3F HL OTF ID CH E10 = 7 7 
tag: 1 B 2F 63 68 30 33 2F 43 |vmgo/book/ch03/C 
length: 29 4 65 73 74 01 00 10 Ea lassFileTest...] 

F 4F 62 6A 65 63 74 01 lava/lang/Obiject. 
bytes: jymgo/book/ch03/ClassFileTest 1 €E €7 2F 52 75 6E 74 |..java/lang/Runt 


图 3-17 ”用 classpy 观 察 CONSTANT _Class_info 第 


量 (2) 


3.3.10 CONSTANT_NameAndType_info 


CONSTANT_NameAndType_info 给 出 字段 或 
方法 的 名 称 和 描述 符 。CONSTANT_Class_info 和 
CONSTANT_NameAndType_info 加 在 一 起 可 以 唯 
一 人 确定 一 个 字段 或 者 方法 。 其 结构 如 下 : 


CONSTANT_NameAndType_info { 
U1 tag; 
U2 name_index; 
U2 descriptor_index; 


} 


字段 或 方法 名 由 name_index 给 出 ， 字 段 或 方 
法 的 描述 符 由 descriptor_index 给 出 。name_index 和 
descriptor_index 都 是 常量 江 索 引 ， 指 癌 
CONSTANT_Utf8_info 第 量 。 字 段 和 方法 名 束 生 代 
码 中 出 现 的 〈 或 者 编译 需 生 成 的 ) 字段 或 方法 的 


名 字 。Java 庶 拟 机 规范 定义 了 一 种 商 单 的 语法 来 搞 
述 字 段 和 方法 ， 可 以 根据 下 面 的 规则 生成 折 述 


a 


从 。 
1) 类 型 描述 符 。 


基本 类 型 byte、short、char、int、long、 
float 和 double 的 摘 述 符 是 单个 字母 ， 分 别 对 心 B 、 
S、C、I、J、F 和 D。 注 意 ，long 的 描述 符 是 J 而 不 


十 L 。 


Co 引用 类 型 的 搞 述 符 是 L 十 类 的 完全 限定 名 十 


人 


(3) 数 组 类 型 的 描述 符 是 [十 数组 元 素 类 型 描 壕 


3) 方法 描述 符 是 〈 分 号 分 隔 的 参数 类 型 描述 
和 从) + 返回 值 类 型 描述 符 ， 其 
字母 V 表 示 。 


更 详细 的 介绍 可 以 参考 Java 虚 拟 机 规范 4.3 
节 。 表 3-3 给 出 了 一 些 具 体 的 例子 。 


表 3-3” 子 段 和 方法 手 述 人生 示例 


字段 描述 符 字段 类 型 方法 描述 符 方 法 
S short OV void IunO 
Liava.lang.Object: java.lang.Object OLiava.lang.String: String toString() 
[I int[] (Ljava.lang.String:)V void main(String[] args) 
[[D double[][] (FF)F int max(float x. float y) 
[Ljava.lang. String: java.lang.Object[] ([IDI int binarySearch(long[] a. long key) 


我 们 都 知道 ，Java 语 言 支持 方法 重 载 
(override) ， 不 同 的 方法 可 以 有 相同 的 名 字 ， 只 
要 参数 列表 不 同 即 可 。 这 束 是 为 什么 
CONSTANT_NameAndType_info 结 构 要 同时 包含 
名 称 和 描述 符 的 原因 。 那 么 字段 呢 ? Java 是 不 能 定 


义 多 个 同名 字段 的 ， 哪 怕 它 们 的 类 型 各 不 相同 。 
这 只 是 Java 语 法 的 限制 而 已 ， 从 class 文 件 的 层面 来 
看 


， 古 完全 可 以 文 持 这 所 的 。 


在 ch03\classfile 目 条 下 创建 
cp_name_and_type.go 文 件 ， 在 其 中 定义 
ConstantName-AndTypeInfo 结 构 体 ， 代 人 码 如 下 : 


package classfile 

type ConstantNameAndTypeInfo struct { 
nameIndex uint16 
descriptorIndex uint16 


func (self *ConstantNameAndTypeInfo) readIinfo(reader 
*ClassReader) { 
self.nameIndex = reader.readUint16() 
self.descriptorIindex = reader.readUint16() 


} 


代码 比较 何 早 ， 束 不 多 解释 了 。 


3.3.11 CONSTANT Fieldref info 、 
CONSTANT Methodref info 和 
CONSTANT InterfaceMethodref info 


CONSTANT_Fieldref_info 表 示 字 有 段 符号 引 
用 ，CONSTANT_Methodref_info 表 示 普 通 ( 非 接 
日 ) 方法 从 守 引 用 ， 
CONSTANT_InterfaceMethodref_info 表 示 接 口 方法 
符号 引用 。 这 三 种 常量 结构 一 模 一 样 ， 为 了 节约 
篇 幅 ， 下 面 只 给 出 CONSTANT _Fieldref info 的 结 


CONSTANT_Fieldref_info { 
ui1 tag ， 
U2 class_index; 
U2 name_and_type_index; 


class_index 和 name_and_type_index 都 是 冲 量 池 
索引 ， 分 别 指向 CONSTANT_Class_info 和 
CONSTANT_NameAndType_info 和 常量 。 先 定义 一 
个 统一 的 结构 体 ConstantMemberrefInfo 来 表示 这 3 
种 常量 。 在 ch03\classfile 目 隶 下 创建 
cp_member_ref.go 文 件 ， 把 下 面 的 代码 输入 进去 。 


package classfile 
type ConstantMemberrefInfo struct { 


cp ConstantPool 
classIndex uint16 
nameAndTypeIndex uint16 


func (self *ConstantMemberrefInfo) readIinfo(reader 

*ClassReader) { 
self.classIndex = reader.readUint16() 
self.nameAndTypeIndex = reader.readUint16() 

} 

func (self *ConstantMemberrefInfo) ClassName() string { 
return self.cp.getClassName(self.classIndex) 


func (self *ConstantMemberrefInfo) NameAndDescriptor() 
(string, string) { 
return self.cp.getNameAndType(self.nameAndTypeIndex) 


} 


然后 定义 三 个 结构 体 “ 继 
其 ”ConstantMemberrefInfo。Go 语 言 并 没有 “ 继 
厌 ” 这 个 概念 ， 但 是 可 以 通过 结构 体能 套 来 模拟 ， 
代码 如 下 : 


type ConstantFieldrefIinfo struct{ ConstantMemberrefInfo } 
type ConstantMethodrefInfo struct{ ConstantMemberrefInfo } 
type ConstantInterfaceMethodrefInfo struct{ 
ConstantMemberrefInfo } 


ClassFileTest 类 的 main () 方法 使 用 了 
java.lang.System 类 的 out 了 字段 ， 该 字段 由 弟 量 池 第 2 
项 指出 ， 如 图 3-18 所 示 。 


可 以 看 到 ，class_index 是 50 (0x32) ， 
name_and_type_index 是 51 (0x33) 。 我 们 找到 第 
50 和 第 51 个 常量 ， 可 以 看 人 天， 确实 是 
CONSTANT_Class_info 和 CONSTANT_Name- 
AndType_info， 如 图 3-19 所 示 。 


ClassFileTest ClassX | 


v constantPool a 000| CR FE BA BE 00 00 00 34 00 40 0A 00 06 00 31 G9 
bp #01 (Methodref); java/lang/Object.</ | QEOMOONS2000N33 08 00 34 OA 00 35 00 36 07 00 37 07 | 
020| 00 38 01 00 04 46 4C 41 47 01 00 01 5A 01 00 0D | 
Mt ab ball ds htt fsa | 030 43 EF 6E 73 74 61 6E 74 56 61 6C 75 65 03 00 00 | 
tag: 9 040| 00 01 01 00 04 42 59 54 45 01 00 01 42 03 00 00 | 
classlndex: 50 050| 00 7B 01 00 01 58 01 00 01 43 03 00 00 00 58 01 | 
0601 00 05 53 48 4F 52 54 01 00 01 53 03 00 00 30 39 | 
nameAndTyYpelndex: 51 了 Ai nN? 站 站 了 用 人 Am SA 站 NAN NT An na NT Se rn 15 M1 1 
刍 3-18 用 al 观察 CONSTANT Fieldref inf 
- Classpy 冰 祭 _Fieldref_ info 
溃 量 
ClassFileTest class X 
: SNA 45 78 63 65 10 74 69 6F |ring;...Exce 
v #50 (Class): java/lang/System 7 
hs A 53 EF 75 72 ‘63: 65 46 .69 {Hs..9,..S0ur 
tag: 7 LI 73 73 46 69 6C 65 54 65 |ie...ClassFi 
namelndex: 58 ic 00 22 00 23 WOONSR OC |st.java..".d 
, ~ A 6 CcC 6 6 2¢ 了 荆 ? -< s sai 
v #51 (NameAndTypej- out&Ljava/io/PrintStream; “ 65 6C De oF 2C 20 5 和 
IC 00 3E 00 3F 01 00 1D :6RA |rld!. .=..>.2 
tag: 12 'F 6B 2F 63 68 30 33 2F 43 |vmgo/book/ck 
namelndex: 59 '5 54 65 73 74 01 00 10 6A |lassFileTest 
descriptorindex: 60 了 2F 4F 562 6R 65 63 74 91 |ava/lang/oObj 
mr 1 PF AT 了 2F SS2 7 GPR 了 4 | 二 strrasyisrmrr/ 


3-19 ”用 classpy 观 察 CONSTANT _Fieldref info 


常量 (2) 


3.3.12 ”常量 祁 小 结 


还 有 三 个 第 量 没有 介绍 : 
CONSTANT_MethodType_info 、 
CONSTANT_MethodHandle_info 和 
CONSTANT_InvokeDynamic_info。 它们 是 Java SE 
7 才 添 加 a 到 class 文 件 中 的 ， 目 的 古文 持 新 增 的 
invokedynamic 指 令 。 本 书 不 讨论 invokedynamic 指 
令 ， 所 以 解析 这 三 个 音量 的 代码 就 不 在 这 里 介绍 
了 。 代 码 也 非常 们 单 ， 有 兴趣 的 读者 可 以 阅读 随 
书 产 代码 中 的 ch03\cp_invoke_dynamic.go 文 件 。 


可 以 把 常量 江 中 的 第 量 分 为 丙 类 : 字面 量 
(literal) 和 符号 引用 (symbolic reference) 。 字 
面 量 包括 数字 第 量 和 字符 串 和 常量 ， 符 号 引 用 包括 


类 和 接口 名 、 字 段 和 方法 信息 等 。 除 了 字面 量 ， 

其 他 稼 量 都 是 通过 索引 直接 或 间接 指 辐 

CONSTANT _Utf8 info 常 量 ， 以 

CONSTANT Fieldref info 为 例 ， 如 图 3-20 所 示 。 
Fieldref info [ 世 Class_info Utfs info 


class index 一 name index bytes 


name and type Index 一 


*» NameAndType info 
name index 


descriptor index 一 


到 3-20 ”和 常量 引用 关系 
本 六 只 是 简单 介绍 常量 池 和 各 种 常量 的 结 
构 ， 在 第 6 间 讨 论 运行 时 常量 池 ， 第 7 章 讨 论 方法 
调用 时 ， 会 进一步 讨论 它们 的 用 途 。 


(ml 
a 


3.4 ”解析 属性 表 


3.2 节 大 致 勾勒 出 了 class 文 件 的 结构 ，3.3 节 介 
绍 了 常量 池 。 细 心 的 读者 一 定 会 发 现 ， 还 有 一 些 
重要 的 信息 没有 出 现 ， 如 方法 的 字 市 码 等 。 那 么 
这 些 信 息 存 在 哪里 呢 ? 答案 是 属性 表 。 属 性 表 可 
谓 是 个 大 杂烩 ， 里 面 存储 了 各 式 各 样 的 信息 。 本 
节 将 详细 讨论 属性 表 。 


3.4.1 ”AttributeInfo 接 口 


和 第 量 池 关 似 ， 各 种 属性 才 达 的 信息 也 各 不 
相同 ， 因 此 无 法 用 统一 的 结构 来 定义 。 不 同 之 处 
在 于 ， 稼 量 是 由 Java 虚 拟 机 规 施 疗 格 定义 的 ， 共 有 
14 种 。 但 属性 是 可 以 扩展 的 ， 不同 的 虚拟 机 实现 
可 以 定义 目 己 的 属性 类 型 。 由 于 这 个 原因 ，Java 虚 
拟 机 规 施 没有 使 用 tag， 而 古 使 用 属性 名 来 区 别 不 
同 的 属性 。 属 性 数据 放 在 属性 名 之 后 的 ul 表 中 ， 
这 样 Java 庶 拟 机 实现 束 可 以 跳 过 目 己 无 法 识别 的 属 
性 。 属 性 的 结构 定义 如 下 : 


attribute_info { 
U2 attribute name_ index; 
u4 attribute_length; 
ui info[attribute length]; 


注意 ， 属 性 表 中 存放 的 属性 名 实际 上 并 不 是 
编码 后 的 字符 串 ， 而 是 常量 池 索 引 ， 指 向 常量 江 
中 的 CONSTANT_Utf8_info 常 量 。 在 ch03\classfile 
目录 下 创建 attribute_info.go 文 件 ， 在 其 中 定义 
AttributeInfo 接 口 ， 代 码 如 下 : 


package classfile 
type AttributeInfo interface { 

readIinfo(reader *ClassReader) 
func readAttributes(reader *ClassReader, cp ConstantPool) 
[]AttributeInfo {...} 
func readAttribute(reader *ClassReader, cp ConstantPool) 
AttributeInfo {...} 
func newAttributeInfo(attrName string, attrLen uint32, 

cp ConstantPool) AttributeInfo {...} 


和 ConstantInfo 接 口 一 样 ，AttributeInfo 接 口 也 
只 定义 了 一 个 readInfo () 方法 ， 需 要 由 具体 的 属 
性 实现 。readAttributes () 函数 读 取 属 性 表 ， 代 码 
如 下 : 


func readAttributes(reader *ClassReader, cp ConstantPool ) 
[JAttributeInfo { 
attributesCount := reader.readUint16() 
attributes := make([]AttributeInfo, attributesCount) 
for i := range attributes { 
attributes[i] = readAttribute(reader, cp) 


return attributes 


函数 readAttribute () 读 取 单个 属性 ， 代 码 如 
下 : 


func readAttribute(reader *ClassReader, cp ConstantPool) 
AttributeInfo { 


attrNameIndex := reader.readUint16() 
attrName := cp.getUtf8(attrNameIndex ) 
attrLen := reader.readUint32() 


attrInfo := newAttributeInfo(attrName, attrLen, cp) 
attrInfo.readInfol(reader ) 
return attrInfo 


readAttribute () 先 读 取 属性 名 索引 ， 根 据 它 
从 常量 池 中 找到 属性 名 ， 然 后 读 取 属性 长 度 ， 接 
着 调用 newAttributeInfo () 函数 创建 具体 的 属性 
实例 。Java 虚 拟 机 规范 预定 义 了 23 种 属性 ， 先 解析 


其 中 的 8 种 。newAttributeInfo () 函数 的 代码 如 
下 : 


func newAttributeInfo(attrName string, attrLen Uint32， 
cp ConstantPool) AttributeInfo { 
switch attrName { 
case "Code": return &CodeAttribute{cp: cp} 
case "ConstantValue": return &ConstantValueAttributef{} 
case "Deprecated": return &DeprecatedAttributef{} 
case "Exceptions": return &ExceptionsAttributef{} 
case "LineNumberTable": return &LineNumberTableAttributef{} 
case "LocalVariableTable": return 
&LocalVariableTableAttribute{} 
case "SourceFile": return &SourceFileAttribute{cp: cp} 
case "Synthetic": return &SyntheticAttributef{} 
default: return &UnparsedAttribute{attrName, attrLen, nil} 


} 


UnparsedAttribute 结 构 体 在 
ch03\classfile\attr_unparsed.go 文 件 中 ， 代 码 如 下 : 


package classfile 

type UnparsedAttribute struct { 
name string 
length uint32 
info [Jbyte 


func (self *UnparsedAttribute) readIinfo(reader *ClassReader) 


self.info = reader.readBytes(self.1length) 


按照 用 途 ，23 种 预定 义 属 性 可 以 分 为 三 组 。 
第 一 组 属性 是 实现 Java 虚 拟 机 所 必需 的 ， 共 有 5 
种 ;第 二 组 属性 是 Java 类 库 所 必需 的 ， 共 有 12 种 ; 
第 三 组 属性 主要 提供 给 工具 使 用 ， 共 有 6 种 。 第 二 
组 属性 是 可 选 的 ， 也 就 是 说 可 以 不 出 现在 class 文 
件 中 。 如 果 class 文 件 中 存在 第 三 组 属性 ，Java 虚 拟 
机 实现 或 者 Java 类 库 也 是 可 以 利用 它们 的 ， 比 如 使 


一 一 一 … 


用 LineNumberTable 属 性 在 异常 堆栈 中 显示 行 配 。 


从 class 文 件 演进 的 角度 来 讲 ，JDK1.0 时 只 有 6 
种 预定 义 属性 ，JDK1.1 增 加 了 3 种 。J2SE 5.0 增 加 
了 9 种 属性 ， 主 要 用 于 文 拧 沁 型 和 注解 。Java SE 6 
增加 了 StackMapTable 属 性 ， 用 于 优化 字 广 人 码 验 
证 。Java SE 7 增加 了 BootstrapMethods 属 性 ， 用 于 
支持 新 增 的 invokedynamic 指 令 。Java SE 8 又 增加 


了 三 种 属性 。 表 3-5 给 出 了 这 23 种 属性 出 现 的 Java 
版 本 、 分 组 以 及 它们 在 class 文 件 中 的 位 置 。 


表 3-4 ”预定 义 属 性 


属性 名 Java SE 位 置 
ConstantValue 1.0.2 field info 
Code 1.0.2 method info 
Exceptions 1:02 method info 
SourceFile 1.0.2 ClassFile 
LineNumberTable 1.0.2 3 Code 
LocalVariableTable | 1.0.2 3 Code 
InnerClasses V 04 ClassFile 
Synthetic 1.1 2 ClassFile. field_info. method info 
Deprecated KT : ClassFile. field_info. method info 
EnclosingMethod 5.0 2 ClassFile 
Signature 5.0 ClassFile. field_info. method_ info 
SourceDebugExtension 5.0 ClassFile 
LocalVariableTypeTable 5.0 Code 
RuntimeVisibleAnnotations 5.0 ClassFile. field_info. method info 
RuntimeInvisibleAnnotations 5.0 ClassFile. field_info. method info 

( 续 ) 

属性 名 Java SE 位 置 
RuntimeVisibleParameterAnnotations 5.0 method info 
RuntimelInvisibleParameterAnnotations 5.0 method info 
AnnotationDefault 5.0 method info 
StackMapTable 6 1 Code 
BootstrapMethods 有 1 ClassFile 
RuntimeVisibleTypeAnnotations | 8 2 ClassFile. field_info. method info. Code 
RuntimeInvisibleTypeAnnotations 8 ClassFile. field_info. method info. Code 
MethodParameters 8 method info 


由 于 篇 幅 的 限制 ， 下 面 只 


介绍 其 中 的 8 种 属 


3.4.2 ”Deprecated 和 Synthetic 属性 


Deprecated 和 Synthetic 是 最 人 简单 的 两 种 属性 ， 
仅 起 标记 作用 ， 不 包含 任何 数据 。 这 两 种 属性 都 
是 JDK1.13 引 入 的 ， 可 以 出 现在 ClassFile 、 
field_info 和 method_info 结 构 中 ， 它 们 的 结构 定义 
如 下 : 


Deprecated attribute { 
U2 attribute name_index; 
u4 attribute_ length; 


} 

Synthetic attribute { 
U2 attribute name_index; 
u4 attribute_ length; 

} 


由 于 不 包含 任何 数据 ， 所 以 attribute_length 的 
值 必 须 是 0。Deprecated 属 性 用 于 指出 类 、 接 口 、 
字段 或 方法 已 经 不 建议 使 用 ， 编 译 硕 等 工具 可 以 


根据 Deprecated 必 性 输出 警 上 香 信 息 。J2SE 5.0 之 前 
可 以 使 用 Javadoc 提 供 的 @deprecated 标 从 指示 编译 
证 给 类 、 接 口 、 字 段 或 方法 添加 Deprecated 属 性， 
语法 格式 如 下 : 


/** Q@deprecated */ 
public void oldMethod() {...} 


从 J2SE 5.0 开 始 ， 也 可 以 使 用 @Deprecated 注 
解 ， 语 法 格式 如 下 : 


@Deprecated 
public void oldMethod() {} 


Synthetic 属 性 用 来 标记 源 文 件 中 不 和 存在、 由 
编译 十 生成 的 类 成 员 ， 引 入 Synthetic 属性 主要 是 
为 了 文 持 敬 侠 类 和 骸 套 接口 。 具 体 细 态 束 不 介绍 
了 ， 感 兴趣 的 读者 可 以 参考 Java 虚 拟 机 规范 相 天 


章节 。 在 ch03\classfile 目 孙 下 创建 attr_markers.go 
文件 ， 在 其 中 定义 DeprecatedAttribute 和 
SyntheticAttribute 结 构 体 ， 代 码 如 下 : 


package classfile 

type DeprecatedAttribute struct { MarkerAttribute } 

type SyntheticAttribute struct { MarkerAttribute } 

type MarkerAttribute struct{} 

func (self *MarkerAttribute) readIinfo(reader *ClassReader) { 
// read nothing 

} 


由 于 这 两 个 属性 部 没有 数据 ， 所 以 readInfo 
() 方法 是 


Ht 
TT 
oO 


3.4.3 ”SourceFile 属 性 


SourceFile 是 可 选 定 长 属性 ， 只 会 出 现在 
ClassFile 结 构 中 ， 用 于 指出 产 文 件 名 。 其 结构 定义 


如 下 : 


SourceFile attribute { 
U2 attribute name_ index; 
u4 attribute_length; 
U2 sourcefile index; 


; 


attribute_length 的 值 必须 是 2。sourcefile_index 


是 常量 池 索 引 ， 指 向 CONSTANT_Utf8_info 常 量 。 


在 ch03\classfile 目 隶 下 创建 attr_source_file.go 文 
件 ， 在 其 中 定义 SourceFileAttribute 结 构 体 ， 代 人 码 


ws 


package classfile 
type SourceFileAttribute struct { 


cp ConstantPool 
sourceFileIndex uint16 


} 
func (self *SourceFileAttribute) readIinfo(reader 
*ClassReader) { 
self.sourceFileIndex = reader.readUint16() 
} 


func (self *SourceFileAttribute) FileName() string { 
return self.cp.getUtf8(self.sourceFileIndex) 
} 


笔者 的 编译 器 给 ClassEileTest 生 成 了 SourceFEile 
属性 ， 如 图 3-21 所 示 。 


v attributes 0340| 00 00 00 09 B2 00 02 12 03 B6 00 04 B1 00 00 00 
| 9 0 08 风 V0 济 计 :多 的 本 而 丽 有 全 
attributeNamelndex- 47 ]370 2 亲生 27 an F 00 01 00 2E 00 人 go 
attributeLength; 2 0380| 2F 00 00 00 02 00 30 
sourceFilelindex: #48->ClassFileTest.java 


3-21 用 classpy 观 察 SourceFile 属 性 


第 47 和 人 第 48 个 常量 ， 确 实 都 是 


CONSTANT _Utf8_info 常 量 ， 如 图 3-22 所 示 。 


> #47 (Utf8): SourceFile 2160| 6E 73 07 00 39 L00025367975997263694669 
b #48 (Utf8). ClassFileTest.java OIC 01 00 12 43 6C 61 73 73 46 69 6C 65 54 65 


图 3-22 ”用 classpy 观 察 SourceFile 属 性 (2) 


3.4.4 ”ConstantValue 属 性 


ConstantValue 是 定 长 属性 ， 只 会 出 现在 
field_info 结 构 中 ， 用 于 表示 常量 表达 式 的 值 〈 详 
见 Java 语 言 规范 的 15.28 节 ) 。 其 结构 定义 如 下 : 


ConstantValue attribute { 
U2 attribute name_ index; 
u4 attribute_length; 

U2 constantvalue_ index; 


; 


attribute_length 的 值 必须 是 2。 
constantvalue_index 古 常量 池 索 引 ， 但 具体 指 问 哪 
种 常量 因 字 段 类 型 而 异 。 表 3-6 给 出 了 字段 类 型 和 
音量 类 型 的 对 应 天 系 。 


表 3-5 ”字段 类 型 和 销量 类 型 对 应 关系 


字段 类 型 常量 类 型 
long CONSTANT Long info 
float CONSTANT Float info 
double CONSTANT Double info 
int. short. char. byte. boolean CONSTANT Integer_ info 
String CONSTANT String info 


在 ch03\classfile 目 杂 下 创建 
attr_constant_value.go 文 件 ， 在 其 中 定义 
ConstantValueAttribute 结 构 体 ， 代 码 如 下 : 


package classfile 
type ConstantValueAttribute Struct { 
constantValueIndex uint16 


func (self *ConstantValueAttribute) readIinfo(reader 
*ClassReader) { 

self.constantValueIndex = reader.readUint16() 
func (self *ConstantValueAttribute) ConstantValueIndex() 


uint16 { 
return self.constantValueIndex 
} 


在 第 6 章 讨论 类 和 对 象 时 ， 会 介绍 如 何 使 用 
ConstantValue 必 性。 下面 用 classpy 观 察 
ClassFileTest 类 的 FLAG 字 段 ， 如 图 3-23 所 示 。 


| ClassFileTest.class X 


v fields 1EC 00 1A tA 6€1 76 61 2F 6C 6€1 6E 67 2F 952 75 6E 74 
v #0: FLAG D01F0| 69 6D 65 45 78 63 65 70 74 69 6F 6E 01 00 10 6aA 
0200| 6L 76 eol 2F 6C 6L 6E 67 2F 53 79 73 74 65 6D 01 
accessFlags: ACC_PUBLIC, ACC_ST; ee EPE 5 PR 
0210 00 O03 6F 可 14 O01 00 可 4C 6R 6 © el 2F 69 6FE 
namelndex- #7->FLAG 0220| 2F 50 72 69 6E 74 53 74 72 65 61 6D 3B 01 00 13 
descriptorindex: #8->Z 023 6A 61 76 61 2F 69 6F 2F 72 69 6E 74 53 74 72 
ttributesC ad 024! 65 61 6D 01 00 07 70 72 69 6E 74 6C 6E 01 15 
a esCoun SN 2 
ee 0251 28 4C 6R 61 76 61 2F 1 6E 2F 53 74 72 69 

v attributes 026! 6E 67 3B 29 56 00 21 00 05 00 06 00 00 00 08 00 | 
v #0 (ConstantValue) 0271 19 00 07 00 08 00 01 896990009000009UD2900E 00 
n28 19 00 0B IC 00 01 00 09 0000 00 02 00 0D 00 
attributeNamelndex: 9 Se a Ss Ee a = nn n i 2 10 
Ue 3U 43 UU UE WU Ir UU UL U Ue U U UU 
attributeLength: 2 02A0| 19 00 11 00 12 00 01 00 09 00 00 00 02 00 13 00 
constantValueindex; #10->1 02B0 19 00 14 00 15 00 01 00 09 00 00 00 02 00 16 00 


图 3-23 ”用 classpy 观 察 ConstantValue 属 性 


可 以 看 到 ， 属 性 表 里 确 实 有 一 个 
ConstantValue 属 性 ，constantvalue index 是 10 
(0x0A) ， 指 向 CONSTANT_Integer_info， 如 图 3- 


24 所 示 。 


ClassFileTest.class X 


A io301 43 6€F 6E 73 74 61 6 
tag: 3 可 0 00 0 5 


和 六 nN 7 
USU UD BS ) 


61 6C 75 65 O30000 
00 01 00 
bytes- 1 03 G9 ?0 00 Sa 01 


图 3-24 ”用 classpy 观 察 ConstantValue 属 性 (2) 


3.4.5 Code 属性 


Code 是 变 长 属性 ， 只 存在 于 method_info 结 构 
中 。Code 属 性 中 存放 字 节 码 等 方法 相关 信息 。 相 
比 前 面 介绍 的 几 种 属性 ，Code 属 性 比较 复杂 ， 其 
结构 定义 如 下 : 


Code_attribute { 
U2 attribute name_ index; 
u4 attribute_ length; 
U2 max_stack; 
U2 max_locals; 
u4 code_length; 
ui code[code_ length]; 
U2 exception_ table _ length; 
{ U2 start_pc; 
U2 end_pc; 
u2 handler_pc; 
U2 catch_type; 
} exception_ table[exception_table length]; 
U2 attributes_ count,; 
attribute info attributes[attributes_ count]; 


max_stack 给 出 探 作 数 栈 的 最 大 深度 ， 


max_locals 给 出 局 部 变量 表 大 小 。 接 看 是 子玉 码 ， 


存在 u1 表 中 。 最 后 是 异 营 处 理 表 和 属性 表 。 在 第 4 
章 讨论 运行 时 数据 区 ， 并 且 实 现 操作 数 栈 和 局 部 
变量 表 时 ，max_stack 和 max_locals 了 驶 会 派 上 用 

场 。 在 第 5 草 讨 论 指令 集 和 人 解释 器 时 ， 会 用 到 字 市 
码 。 在 第 10 章 讨论 异常 处 理 时 ， 会 使 用 异常 处 理 
表 。 


把 Code 属 性 结构 翻 详 成 Go 结构 体 ， 定 义 在 
ch03\classfile\attr_code.go 文 件 中 ， 代 码 如 下 : 


package classfile 
type CodeAttribute struct { 


cp ConstantPool 
maxStack uint16 
maxLocals uint16 
code [jbyte 
exceptionTable []j*ExceptionTableEntry 
attributes []AttributeInfo 
} 
type ExceptionTableEntry Struct { 
StartPc uint16 
endPc uint16 
handlerPpc uint16 
catchType uint16 


func (self *CodeAttribute) readIinfo(reader *ClassReader) 


readInfo () 方法 的 代码 如 下 : 


func (self *CodeAttribute) readIinfo(reader *ClassReader) { 
self.maxStack = reader.readUint16() 
self.maxLocals = reader.readUint16() 
codeLength := reader .readUint32() 
self.code = reader.readBytes(codeLength) 
self.exceptionTable = readExceptionTable(reader) 
self.attributes = readAttributes(reader, self.cp) 


readExceptionTable () 函数 的 代码 如 下 : 


func readExceptionTable(reader *ClassReader) 
[J]j*ExceptionTableEntry { 
exceptionTableLength := reader.readUint16() 
exceptionTable := make([]*ExceptionTableEntry, 
exceptionTableLength) 
for i := range exceptionTable { 
exceptionTable[i] = &ExceptionTableEntryt{ 
StartPc : reader .readUint16(), 
endPc : reader .readUint16(), 
handlerPc: reader.readUint16(), 
catchType: reader.readUint16(), 
} 
} 


return exceptionTable 


ClassFileTest.main () 方法 的 Code 属 性 如 图 3- 
25 有 所 示 。 


jj02101 00 03 6F 75 74 01 00 15 4C €A 61 76 61 2F 69 €F 
0220| 2F 50 72 69 6E 74 53 74 72 65 61 6D 3B 01 00 13 
GOCOSS ANS ACC-PUB LGACCSFATIC loz301 é€A 61 76 €1 2F €9 6F 2F 50 72 €9 6E 74 53 74 72 
namelndex: #41->main lo240| 65 61 6D 01 00 07 70 72 69 6€E 74 6c 6E 01 00 15 
descriptorindex: #42->(lLjava/lang/String:)V | ||0250| 28 4C 6R 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 

lIo260| 6E 67 3B 29 56 00 21 00 05 00 06 00 00 00 08 00 

attributesCount: 2 ioz2701 19 00 07 00 08 00 01 00 09 00 00 00 02 00 OA 00 
v attributes |lo280| 19 00 oB 00 Oc 00 01 00 09 00 00 00 02 00 OD 00 
|lo290| 19 oo OF 00 oF 00 01 00 09 00 00 00 02 00 10 00 
02A0| 19 00 11 00 12 00 01 00 09 00 00 00 02 00 13 00 
02B01 19 00 14 00 15 00 01 00 09 00 00 00 02 00 16 00 


v #1: main 


attributeNamelndex- 36 | 


attributeLength: 55 lo2c0| 19 00 17 00 18 00 01 00 09 00 00 00 02 00 19 00 
maxStack: 2 lo2D0| 19 00 3B 00 ic 00 01 00 09 90 00 00 02 00 1D 00 
ml lo2E0| 19 00 1E 00 1F 00 01 00 09 00 00 00 02 00 20 00 
|lo2F0| 02 00 01 00 22 00 23 00 01 00 24 00 00 00 2F 00 
codeLength: 9 |lo300| 01 00 01 00 00 00 05 2A B7 00 01 Bi 00 00 00 02 
» code lo3101 00 25 00 00 00 06 00 01 00 00 00 03 00 26 00 00 
exepdorTaDIEEENOUHSO 9 00 oc 00 01 00 00 00 05 00 27 00 28 00 00 60 09 
| 
exceptionTable | 
attributesCount: 2 
> attributes 
b #1 (Exceptions) n3801 2 Nn2 AN 30 


图 3-25 ”用 classpy 观 察 Code 属 性 


3.4.6 ”Exceptions 属 性 


Exceptions 是 变 长 属性 ， 记 和 隶 方 法 抛 出 的 异常 
表 ， 其 结构 定义 如 下 : 


Exceptions_attribute { 
U2 attribute name_ index; 
u4 attribute_length; 
U2 number_of_exceptions; 
U2 exception_ index_table[fnumber_of_exceptions]; 


在 ch03\classfile 目 孙 下 创建 attr_exceptions.go 
文件 ， 在 其 中 定义 ExceptionsAttribute 结 构 体 ， 代 
人 码 如 下 : 


package classfile 
type ExceptionsAttribute struct { 
exceptionIndexTable []uint16 


func (self *ExceptionsAttribute) readIinfo(reader 
*ClassReader) { 

self.exceptionIndexTable = reader.readUint16s() 
} 


func (self *ExceptionsAttribute) ExceptionIndexTable() 
[Juint16 { 


return self.exceptionIndexTable 


代码 比较 商 单 ， 驶 不 多 解释 了 。 
ClassFileTest.main () 方法 的 Exceptions 属 性 如 图 
3-26 所 示 。 


v #1. main 0280| 19 00 0B 00 Oc 00 01 00 0D 
accessFlags: ACC_PUBLIC, ACC_STATIC 0290| 19 00 OE 00 OF 00 01 00 10 
02a0| 19 11 00 12 00 01 00 13 
namelndex: #41->main 和 = 二 汪 = PS i 
02B0 19 00 14 00 15 0 V2 DU 16 
descriptorindex: #42->{[Ljava/lang/String;)vV 02c0| 19 00 17 00 18 00 01 00 19 
attributesCount 2 02D0| 19 00 1B 00 1C 00 01 00 1D 
02 Nn Q 1F NO | Dn 01 nO0 了 门 
v attributes SP a Pl 人 
FO 01 00 22 D 23 00 2F 
» #0 (Code) 01 00 00 00 05 2A 00 
v #1 (EXCeptions) 00 00 00 06 00 01 00 
attributeNamelndex: 45 < 2 ; 3 > 
0 2 2 00 24 { 00 
attributeLength; 4 0 09 02 12 00 
numberOfExceptions: 1 5 00 DA 00 08 
v exceptionindexTable 6 09 00 00 OC 00 <“B 
0 00 2D 00 00 00 01 

#0: #46->java/lang/RuntimeException 0 00 02 00 30 


图 3-26 ”用 classpy 观 察 Code 属 性 


3.4.7 LineNumberTable 和 和 
LocalVariableTable 属 性 


LineNumberTable 属 性 表 存 放 方 法 的 行 号 信 
忌 ，LocalVariableTable 属 性 表 中 存放 方法 的 局 部 
变量 信息 。 这 两 种 属性 和 前 面 介绍 的 SourceFile 属 
性 都 属于 调试 信息 ， 都 不 是 运行 时 必需 的 。 在 使 
用 javac 编 译 器 编译 Java 程 序 时 ， 默 认 会 在 class 文 
件 中 生成 这 些 信息 。 可 以 使 用 javac 提 供 的 -g: 
none 侈 项 来 天 闭 这 些 信息 的 生成 ， 这 里 就 不 多 介 


绍 了 了 人， 具体 请 参考 javac 用 法 。 


LineNumberTable 和 LocalVariableTable 属 性 表 
在 结构 上 很 像 ， 下 面 以 LineNumberTable 为 例 进 行 
讨论 ， 它 的 结构 定义 如 下 : 


LineNumberTable_attribute { 
U2 attribute name_index; 
u4 attribute_length; 
U2 line_number_table_ length; 
{ U2 start_pc,; 
U2 line_number; 
} line_number_table[line number_table length]; 


把 上 面 的 结构 定义 翻译 成 Go 结构 体 ， 定 义 在 
ch03\classfilevattr_line_number_table.go 文 件 中 ， 代 
但 如 下 : 


package classfile 

type LineNumberTableAttribute struct { 
lineNumberTable []*LineNumberTableEntry 

} 


type LineNumberTableEntry struct { 
StartPc uint16 
lineNumber uint16 


func (self *LineNumberTableAttribute) readIinfo(reader 
*ClassReader) {...} 


readInfo () 方法 读 取 属性 表 数 据 ， 代 码 如 
下 : 


func (self *LineNumberTableAttribute) readIinfo(reader 
*ClassReader) { 
lineNumberTableLength := reader.readUint16() 
self.lineNumberTable = make([]*LineNumberTableEntry, 
lineNumberTableLength) 
for i := range self.lineNumberTable { 
self.lineNumberTable[i] = &LineNumberTableEntryt{ 
startPc: reader .readUint16(), 
lineNumber: reader.readUint16(), 


在 第 10 划 讨论 异常 处 理 时 会 详细 讨论 


LineNumberTable 属 性 。 


3.5 测试 本 章 代 码 


在 第 2 章 的 测试 中 ， 把 dlass 文 件 加 载 到 了 内 存 
中 ， 并 且 把 一 扒 看 似 杂乱 无 章 的 数字 打印 到 了 控 
制 合 。 相 信 谈 彰 一 定 不 会 满足 于 此 。 本 世 吏 来 修 
改 测 试 代 码 ， 把 命令 行 工 具 临 时 打造 成 一 个 傈 化 
版 的 javap 。 


打开 ch03\main.go 文 件 ， 修 改 import 语 句 和 
startJVM () 男 数 ， 代 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/ch03/classfile" 

import "jvmgo/ch03/classpath" 

func main() {...} 

func startJVM(options *cmdline.Options, class string, args 
[jstring) {...} 


main () 函数 不 用 变 ， 修 改 starUJVM () 画 
数 ， 代 码 如 下 : 


func startJVM(cmd *Cmd) { 
cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
className := strings.Replace(cmd.class, ".", "/", -1) 
cf := loadCclass(className, cp) 
fmt.Println(cmd.class) 
printClassInfo(cf) 

} 


loadClass () 男 数 读 取 并 解析 class 文 件 ， 代 
人 码 如 下 : 


func loadClass(className string, cp *classpath.classpath) 
*classfile.ClassFile { 
classData, _, err := cp.ReadClass(className) 
if err != nil { 
panic(err) 
cf, err := classfile.Parse(classData) 
If err != nil { 
panic(err) 


return cf 


printClassInfo () 函数 把 class 文 件 的 一 些 重要 
言 轧 打印 出 来 ， 代 码 如 下 : 


func printClassInfo(cf *classfile.ClassFile) { 
fmt.Printf("version: %v.%v\n", cf.MajorVersion(), 
cf.MinorVersion()) 
fmt.Printf("constants count: %v\n", 
len(cf.ConstantPool())) 
fmt.Printf("access flags: Ox%x\n", cf.AccessFlags()) 
fmt.Printf("this class: %\n", cf.ClassName( ) ) 
fmt.Printf("super class: %v\n", cf.SuperClassName()) 
fmt.Printf("interfaces: %v\n", cf.InterfaceNames()) 
fmt.Printf("fields count: %v\n", len(cf.Fields())) 
for f := range cf.Fields() { 
fmt. Printf(" %s\n", f.Name()) 


} 
fmt.Printf("methods count: %v\n", len(cf.Methods())) 
for _, m := range cf.Methods() { 

fmt.Printf(" %s\n", m.Name()) 


小 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 
代码 。 


go install jvmgo\ch03 


编译 成 功 后 ， 在 D: \govworkspace\bin 目 录 下 
会 出 现 ch03.exe 文 件 。 执 行 ch03.exe， 指 定 -又 jre 迁 
项 和 类 名 ， 丈 可 以 打印 出 class 文 件 的 信息 。 笔 兰 
把 java.lang.String.class 文 件 (位 于 rt.jar 中 ) 的 信息 
打印 了 出 来 ， 如 图 3-27 所 示 。 如 采访 者 想 测 试 目 
己 编 写 的 类 ， 记 得 要 指定 - | 先 项 。 与 第 2 划 
相 比 ， 我 们 显然 取得 了 很 大 的 进 


丽 命令 提示 符 - 口 x 
D:\go\workspace\bin>ch03 -Xire “C:\Program Files\Java\irel. 8.0 66 java. lang. StrlG 
ing 

java. lang. String 

wersion: 52.0 


了 


constants count: 531 
access flags: OQx31 
this class: java/lang/String 
super class: iava/lang/Obiject 


interfaces: [java/io/Serializable java/lang/Comparable java/lang/CharSequence] 
fields count: 5 

value 

hash 

serialyersionUID 

serialPersistentFields 

CASE_INSENSITIVE ORDER 
methods count: 94 

<init> 

<init> 


图 3-27 ”ch03.exe 的 测试 结 


3.6 “本章 小 结 


计算 机 科学 家 David Wheeler 有 一 句 名 言 :“ 计 
算 机 科学 中 的 任何 难题 都 可 以 通过 增加 一 个 中 间 
层 来 解决 > 上。ClassFile 结 构 体 就 是 为 了 实现 类 加 
载 功能 而 增加 的 中 间 层 。 在 第 6 章 ， 我 们 会 进一步 
处 理 ClassFile 结 构 体 ， 把 它 转变 Class 结 构 体 ， 并 
放 入 方法 区 。 不 过 在 此 之 前 ， 要 先 在 第 4 章 实 现 运 
行 时 数据 区 ， 在 第 5 章 实 现 字 市 码 解 释 絮 。 


[1] 原文 为 All problems in computer science can be 


solved by another level of indirection 。 


第 4 章 ”运行 时 数据 区 


第 1 章 编写 了 命令 行 工具 ， 第 2 章 和 第 3 章 讨论 
了 如 何 搜索 和 解 机 class 文件。 读者 也 许 有 些 着 急 
了 ， 为 什么 读 到 第 4 章 后 连 Java 虚 拟 机 的 影子 都 还 
没有 看 到 ? 别 着 急 ， 本 章 束 来 讨论 并 初步 实现 运 
行 时 数据 区 (run-time data area) ， 为 下 一 章 编写 
字 市 码 解 释 屁 做 准备 。 


在 开始 阅读 本 章 之 前 ， 还 是 完 准 备 好 目 隶 结 
构 。 复 制 ch03 目 隶 ， 改 名 为 ch04。 修 改 main.go 等 
产 文 件 ， 把 import 语 句 中 的 ch03 全 都 改 成 ch04， 人 然 
后 在 ch04 目 录 下 创建 rtda 1 直子 目 录 。 现 在 我 们 的 
目录 结构 应 该 如 下 所 示 : 


D:\go\workspace\src 
|-jvmgo 


| -cho01 ~ ch03 
| -ch04 
|-classfile 
|-classpath 
|-rtda 
| -cmd ,go 
| -main ,go 


[1] rtda 是 run-time data areab 风 首 字 母 缩 写 。 


4.1 运行 时 数据 区 概述 


在 运行 Java 程 序 时 ，Java 虚 拟 机 需要 使 用 内 存 
来 存放 各 陈 各 样 的 效 据 。Java 庶 拟 机 规 苑 把 这 些 内 
存 区 域 叫 作 运 行 时 数据 区 。 运 行 时 数据 区 可 以 分 
为 两 类 : 一 类 是 多 线程 共享 的 ， 另 一 类 则 是 线程 
私有 的 。 多 线程 共 圣 的 运行 时 数据 区 需要 在 Java 虚 
拟 机 启动 时 创建 好 ， 在 Java 虚 拟 机 退出 时 销 贤 。 线 
程 私 有 的 运行 时 数据 区 则 在 创建 线程 时 才 创 建 ， 
线程 退出 时 销毁 。 


多 线程 共 圣 的 内 存 区 域 主要 存放 两 类 数据 : 
类 数据 和 类 实例 (也 束 是 对 象 ;。 对 和 象 数 据 存 放 
在 堆 (Heap) 中 ， 类 数据 存放 在 方法 区 (Method 
Area) 中 。 堆 由 垃圾 收集 器 定期 清理 ， 所 以 程序 


员 不 需要 关心 对 象 空间 的 释放 。 类 数据 包括 字段 
和 方法 信息 、 方 法 的 字 世 码 、 运 行 时 音量 池 ， 等 
等 。 从 逻辑 上 来 讲 ， 方 法 区 其 实 也 是 堆 的 一 部 


让 
由 
O 


线程 私有 的 运行 时 数据 区 用 于 辅助 执行 Java 字 
六 码 。 每 个 线程 都 有 自己 的 pc 寄存 器 (Program 
Counter) 和 Java 庶 拟 机 栈 (JVM Stack) 。Java 虚 
拟 机 栈 又 由 栈 帧 (Stack Frame， 后 面 简称 帧 ) 构 
成 ， 帧 中 保存 方法 执行 的 状态 ， 包 括 局 部 变量 表 

(Local Variable) 和 操作 数 栈 (Operand Stack) 
等 。 在 任 一 时 刻 ， 某 一 线程 肯定 是 在 执行 某 个 方 
法 。 这 个 方法 叫 作 该 线程 的 当前 方法 ; 执行 该 方 
法 的 帆 叫 作 线 程 的 当前 巾 ， 声 明 该 方法 的 类 叫 作 
当前 类 。 如 果 当 前 方法 是 Java 方 法 ， 则 pc 寄存 器 中 
存放 当前 正在 执行 的 Java 虚 拟 机 指令 的 地 址 ， 否 


则 ， 当 前 方 涛 是 本 地 方法 ，pc 寄 人 存 厚 中 的 值 没有 
明确 定义 。 


根据 以 上 摘 述 ， 可 以 大 致 义 勒 出 运行 时 数据 
区 的 逻辑 结构 ， 如 向 4-1 所 示 。 


Run-Time Data Area 


Thread Heap 
pe Method Area 
JVM Stack C4 
Run-Time 
a Constant Pool 
Local Variable 
Operand Stack Object 


色 4-1 ”运行 时 数据 区 示意 图 


Java 庶 拟 机 规 匈 对 于 运行 时 数据 区 的 规定 古 相 
当 宽松 的 。 以 堆 为 例 ， 堆 可 以 古 连 续 空 间 ， 也 可 
以 不 连续 。 堆 的 大 小 可 以 固定 ， 也 可 以 在 运行 时 
按 需 扩 展 站 。 虚 拟 机 实现 者 可 以 使 用 任何 垃圾 回 
收 算法 害 理 堆 ， 其 至 完全 不 进行 坪 圾 收集 也 是 可 
以 的 。 由 于 Go 本 喘 也 有 垃圾 回收 功能 ， 所 以 可 以 
直接 使 用 Go 的 堆 和 芭 圾 收集 工 ， 这 大 大 商 化 了 我 
们 的 工作 。 


本 草 将 初步 实现 线程 私有 的 运行 时 数据 区 ， 


[1] java 命 令 提 供 了 -Xms 和 -Xmx 两 个 非 标 准 选 项 ， 
用 来 调整 堆 的 初始 大 小 和 最 大 大 小 。java 命 令 的 许 


细 介 绍 请 参考 第 1 章 内 容 。 


4.2 ”数据 类 型 


Java 虚 拟 机 可 以 操作 两 类 数据 :基本 类 型 
(primitive type) 和 引用 类 型 (reference type) 
基本 类 型 的 变量 存放 的 就 是 数据 本 身 ， 引 用 类 型 
的 变量 存放 的 是 对 象 引 用 ， 真 正 的 对 象 数据 是 在 
堆 里 分 配 的 。 这 里 所 说 的 变量 包括 类 变量 (静态 
字段 ) 、 实 例 变量 〈 非 静态 字段 ) 、 数 组 元 素 、 

方法 的 参数 和 局 部 变量 ， 等 等 。 


基本 类 型 可 以 进一步 分 为 布尔 类 型 (boolean 
type) 和 数字 类 型 (numeric type) 1 ， 数 字 类 型 
又 可 以 分 为 整数 类 型 (integral type) 和 浮 点 数 类 
型 (floating-point type) 。3 引 用 类 型 可 以 进一步 分 
为 3 种 : 类 类 型 、 接 口 类 型 和 数组 类 型 。 类 类 型 引 


用 指向 类 实例 ， 数 组 类 型 引用 指 同 数组 实例 ， 接 
口 类 型 引用 指向 实现 了 该 接口 的 类 或 数组 实例 。 

引用 类 型 有 一 个 特殊 的 值 一 一 nul， 表 示 该 引用 不 
指 回 任何 对 象 。 


Go 语言 提供 了 非常 丰富 的 数据 类 型 ， 包 括 各 
种 整数 和 两 种 精度 的 浮 点 数 。Java 和 Go 的 浮 点 数 
都 采用 IEEE 754 规 范 111。 对 于 基本 类 型 ， 可 以 直 
接 在 Go 和 Java 之 间 建 立 映 射 关 系 。 对 于 引用 类 
型 ， 自 然 的 选择 是 使 用 指针 。Go 提 供 了 nil， 表 示 
空 指针 ， 正 好 可 以 用 来 表示 null。 由 于 要 到 第 6 章 
才 开始 实现 类 和 对 象 ， 所 以 本 章 先 定义 一 个 临时 
的 结构 体 ， 用 它 来 表示 对 象 。 在 ch04\rtda 目 录 下 创 
建 object.go， 在 其 中 定义 Object 结 构 体 ， 代 码 如 
下 : 


package rtda 


type Object struct { 
// todo 


表 4-1 对 Java 庶 拟 机 文 持 的 类 型 进行 了 总 结 。 


表 4-1 _ Java 虚拟 机 数据 类 型 


Java 数据 类 型 Go 数据 类 型 
byte int8 
short int16 

整数 类 型 int int32 
数字 类 型 long int64 
a char uint16 
浮 点 数 类 型 2 
double float64 
布尔 类 型 boolean bool 
类 类 型 *Object 
引用 类 型 接口 类 型 *Object 
和 数组 类 型 *Object 
null nil 


[1] 还 有 一 种 基本 类 型 是 returnAddress， 它 和 jsr、 
ret、ret_w 指 令 一 起 ， 用 来 实现 finally 子 句 。 不 过 
从 Java 6 开始 ，Oracle 的 Java 编 译 絮 已 经 不 再 使 用 


这 二 条 指令 了 。 详 细 情 况 请 参考 第 10 章 内 容 。 


[2] 本 书 不 讨论 浮 点 数 细节 ， 如 在 内 存 中 的 编码 形 
式 等 。 如 有 果 读 者 需要 了 解 这 方面 的 知识 ， 可 以 阅 
读 Java 虚 拟 机 规范 或 IEEE 754 规 范 的 相关 章节 。 


4.3 实现 运行 时 数据 区 


前 面 两 万 介绍 了 一 些 必要 的 理论 ， 并 且 定 义 
了 Object 结 构 体 。 本 十 将 实现 线程 私有 的 运行 时 
数据 区 。 下 面 完 从 线程 开始 。 


4.3.1 ”线程 


在 ch04Njvmrtda 目 孙 下 创建 thread.go 文 件 ， 在 
其 中 定义 Thread 结 构 体 ， 代 码 如 下 : 


package rtda 


type Thread struct { 
int 
*Stack 


pc 
stack 


} 

func 
func 
func 
func 
func 
func 


NewThread() *Thread {...} 


(self 
(self 
(self 
(self 
(self 


*Thread) 
*Thread) 
*Thread) 
*Thread) 
*Thread) 


PC() int { return self.pc } // getter 
SetPC(pc int) { self.pc = pc } // setter 
PushFrame(frame *Frame) {...} 

PopFrame() *Frame {...} 

CurrentFrame() *Frame {...} 


目前 只 定义 了 pc 和 stack 两 个 字段 。pc 字 段 无 
需 解 释 ，stack 字 段 是 Stack 结 构 体 (Java 虚 拟 机 
栈 ) 指针 。Stack 结 构 体 在 4.3.2 节 介绍 。 


和 堆 一 样 ，Java 虚 拟 机 规范 对 Java 虚 拟 机 栈 的 
约束 也 相当 宽松 。Java 庶 拟 机 栈 可 以 是 连续 的 空 


间 ， 也 可 以 不 连续 ;， 可 以 是 固定 六 小， 也 可 以 在 
运行 时 动态 扩展 出。 如 果 Java 虚 拟 机 栈 有 大 小 限 
制 ， 且 执行 线程 所 需 的 栈 空 间 超出 了 这 个 限制 ， 
会 导致 StackOverflowError 异 常 搜 出 。 如 果 Java 虚 
拟 机 栈 可 以 动态 扩展 ， 但 是 内 存 已 经 耗 尽 ， 会 导 
致 OutOfMemoryError 腊 常 抛 出 。 


NewThread () 函数 创建 Thread 实 例 的 代码 如 
下 : 


func NewThread() *Thread { 
return &Thread 
stack: newStack(1024), 
} 
} 


newStack () 画 数 创 建 Stack 结 构 体 实例 ， 它 
的 参数 表示 要 创建 的 Stack 和 最 多 可 以 容纳 多 少 帧 ， 
4.3.2 玫 将 给 出 这 个 国 数 的 代码 。 这 里 暂时 将 它 赋 


值 为 1024， 感 兴趣 的 读 痢 可 以 修改 我 们 的 命令 行 


工具 ， 谎 加 选项 来 指定 这 个 参数 。 


PushFrame () 和 PopFrame () 方法 只 是 调 
用 Stack 结 构 体 的 相应 方法 而 已 ， 代 码 如 下 : 


func (self *Thread) PushFrame(frame *Frame) { 
self.stack.push(frame) 


func (self *Thread) PopFrame() *Frame { 
return self.stack.pop() 


} 


CurrentFrame () 方法 返回 当前 帧 ， 代 码 如 
下 : 


func (self *Thread) CurrentFrame() *Frame { 
return self.stack.top() 


} 


[1] java 命 令 提 供 了 -Xss 选 项 来 设置 Java 虚 拟 机 栈 
大 小 。 


4.3.2 ” Java 虚拟 机 栈 


如 前 所 述 ，Java 虚 拟 机 规范 对 Java 虚 拟 机 栈 的 
约束 非常 宽松 。 我 们 用 经 典 的 链表 (linked list) 
数据 结构 来 实现 Java 虚 拟 机 栈 ， 这 样 栈 就 可 以 按 
需 使 用 内 存 空间 ， 而 且 弹 出 的 帧 也 可 以 及 时 被 Go 
的 垃圾 收集 器 回收 。 在 ch04jyvm\rtda 目 录 下 创建 
jvm_stack.go 文 件 ， 在 其 中 定义 Stack 结 构 体 ， 代 
码 如 下 : 


package rtda 
type Stack struct { 


maxSize uint 
size uint 
_top *Frame 


} 

func newStack(maxSize uint) *Stack {...} 
func (self *Stack) push(frame *Frame) {...} 
func (self *Stack) pop() *Frame {...} 

func (self *Stack) top() *Frame {...} 


maxSize 字 段 你 存 栈 的 容量 (最 多 可 以 容纳 多 
少 帧 ) ，size 字 段 保 存 栈 的 当前 大 小 ，_top 字 段 保 
存 栈 顶 指针 。newStack () 画 数 的 代码 如 下 : 


func newStack(maxSize uint) *Stack { 
return &Stacki{ 
maxSize: maxSize, 


push () 方法 把 帧 推 入 栈 顶 ， 代 码 如 下 : 


func (self *Stack) push(frame *Frame) { 
If self.size >= self.maxSize { 
panic("java.lang.StackOverflowError") 


If self. top != nil { 
frame.lower = self._top 


self._ top = frame 
self.sizet+ 


} 


如 采 栈 已 经 满 了 ， 按 照 Java 虚 拟 机 规范 ， 应 
该 抛 出 StackOverflowError 异 常 。 在 第 10 章 才 会 讨 


论 异 常 ， 这 里 先 调 用 panic () 函数 终止 程序 执 
a () 方法 把 栈 顶 帧 弹出 ， 代 码 如 下 : 


func (self *Stack) pop() *Frame { 
If self. top == nil 
panic("jvm stack is empty!") 


top := self._top 
self._ top = top.lower 
top.lower = nil 
self.size-- 

return top 


} 


如 有 果 此 时 栈 是 空 的 ， 肯 定 是 我 们 的 虚拟 机 有 
bug， 调 用 panic 〈) 函数 终止 程序 执行 即 可 。top 
() 方法 只 是 返回 栈 顶 帧 ， 但 并 不 弹出 ， 代 码 如 
下 : 


func (self *Stack) top() *Frame { 
if self. top == nil { 
panic("jvm stack is empty!") 


} 
return self._top 


} 


4.3.3 有 帧 


在 ch04jvm\rtda 目 录 下 创建 frame.go 文 件 ， 在 
其 中 定义 Frame 结 构 体 ， 代 码 如 下 : 


package rtda 
type Frame struct { 


lower *Frame 

JocalVars LocalVars 
operandStack *OperandStack 
} 


func newFrame(maxLocals, maxStack uint) *Frame {...} 


Frame 结 构 体 获 时 也 比较 简单 ， 只 有 三 个 字 
段 ， 后 续 章 和 还 会 继续 完善 忌 。lower 字 段 用 来 实 
现 链表 数据 结构 ，localVars 字 段 保存 局 部 变量 表 指 
计 ，operandStack 字 段 你 存 操作 数 栈 指针 。 
NewFrame () 函数 创建 Frame 实 例 ， 代 码 如 下 : 


func NewFrame(maxLocals, maxStack uint) *Frame { 
return &Frame{ 
localVars: newLocalVars(maxLocals), 


operandStack: newoperandStack(maxStack ) ， 


执行 方法 所 需 的 局 部 变量 表 大 小 和 操作 数 栈 
深度 是 由 编译 需 预 先 计 算 好 的 ， 存 储 在 class 文 件 
method_info 结 构 的 Code 属 性 中 ， 具 体 可 以 参考 


3.4.5 节 。 


Thread、Stack 和 Frame 结 构 体 的 代码 都 已 经 给 
出 了 ， 根 据 代 码 ， 可 以 画 出 Java 虚 拟 机 栈 的 链表 结 
构 ， 如 图 4-2 所 示 。 


Stack rT Frame TT Frame nr Frame 
lower lower lower 


_top 


图 4-2 ”使 用 链表 实现 Java 虚 拟 机 栈 


4.3.4 局 部 变量 表 


局 部 变量 表 是 按 索 引 访问 的 ， 所 以 很 目 然 ， 
可 以 把 它 想 象 成 一 个 数组 。 根 据 Java 虚 拟 机 规 
范 ， 这 个 数组 的 每 个 元 素 至 少 可 以 容纳 一 个 int 或 
引用 值 ， 两 个 连续 的 元 素 可 以 容纳 一 个 long 或 
double 值 。 


那么 使 用 哪 种 Go 语言 数据 类 型 来 表示 这 个 数 
组 呢 ? 最 容易 想到 的 是 [int。Go 的 int 类 型 因 平 台 
而 异 ， 在 64 位 系统 上 是 int64， 在 32 位 系统 上 是 
int32， 总 之 足够 容纳 Java 的 int 类 型 。 另 外 它 和 内 
置 的 uintptr 类 型 视 度 一 样 ， 所 以 也 足够 放下 一 个 
内 存 地 址 。 通 过 unsafe 包 可 以 拿 到 结构 体 实例 的 
地 址 ， 如 下 所 示 : 


obj := &O0bject{} 
ptr := uintptr(unsafe.Pointer(obj)) 
ref := int(ptr) 


但 壮 憾 的 是 ，Go 的 垃圾 回收 机 制 并 不 能 和 有效 
处 理 uintptr 指 秆 。 也 就 是 说 ， 如 来 一 个 结构 体 实 
例 ， 除 了 uintptr 类 型 指针 保存 它 的 地 址 之 外 ， 其 
他 地 方 都 没有 3 引用 这 个 实例 ， 它 束 会 饭 当 作 坪 专 
回收 。 


另外 一 个 方案 是 用 [interface{} 类 型 ， 这 个 方 
案 在 实现 上 没有 问题 ， 只 是 写 出 来 的 代码 可 该 性 
太 关 。 第 二 种 方案 是 定义 一 个 结构 体 ， 让 它 可 以 
同时 容纳 一 个 int 值 和 一 个 引用 值 。 这 里 将 使 用 第 
三 种 方案 。 在 ch04\rtda 目 录 下 创建 slot.go 文 件 ， 在 
其 中 定义 Slot 结 构 体 ， 代 码 如 下 : 


package rtda 
type Slot struct { 


num Int32 
ref *Object 
} 


num 字 上 段 存 放 整 数 ，ref 字 上 段 存 放 引 用 ， 刚 好 
满足 我 们 的 需求 。 下 面 用 它 来 实现 局 部 变量 表 。 
在 ch04rtda 目 孙 下 创建 local_vars.go 文 件 ， 在 其 中 
定义 LocalVars 类 型 ， 代 码 如 下 : 


package rtda 
import "math" 
type LocalVars [1]Slot 


继续 编辑 local_vars.go 文 件 ， 在 其 中 定义 
newLocalVars () 函数 ， 代 码 如 下 : 


func newLocalVars(maxLocals uint) LocalVars { 
If maxLocals > 0 
return make([]Slot, maxLocals) 


return nil 


} 


newLocalVars () 玉 数 创建 LocalVars 实 例 ， 
代码 比较 人 简单， 这 里 束 不 多 解 秋 了 。 


在 第 5 章 大 家 会 看 到 ， 操 作 局 部 变量 表 和 操作 
效 栈 的 指令 都 是 隐 合 类 型 信息 鸭 。 下 面 给 
LocalVars 类 型 定义 一 些 方 法 ， 用 来 存 取 不 同类 型 
的 变量 。int 变 量 最 简单 ， 直 搂 存 取 即 可 。 


func (self LocalVars) SetIint(index uint, val int32) { 
self[index].num = val 


func (self LocalVars) GetIint(index uint) int32 { 
return self[index].num 


float 变 量 可 以 先 转 成 int 类 型 ， 然 后 按 int 变 量 
来 处 理 。 


func (self LocalVars) SetFloat(index uint, val float32) { 
bits := math.Float32bits(val) 
self[index] .num = int32(bits) 


} 
func (self LocalVars) GetFloat(index uint) float32 { 
bits := uint32(self[index].num) 


return math.Float32frombits(bits) 


long 变 量 则 需要 拆 成 两 个 int 变 量 。 


func (self LocalVars) SetLong(index uint, val int64) { 
self[index] .num = int32(val) 
self[index+1] .num = int32(val >> 32) 


func (self LocalVars) GetLong(index uint) int64 { 
low := uint32(self[index].num) 
high := uint32(self[index+1].num) 
return int64(high)<<32 | int64(Jlow) 


double 变 量 可 以 先 转 成 long 类 型 ， 人 然后 按照 
long 变 量 来 处 理 。 


func (self LocalVars) SetDouble(index uint, val float64) { 
bits := math.Float64bits(val) 
self.SetLong(index, int64(bits)) 
} 
func (self LocalVars) GetDouble(index uint) float64 { 
bits := uint64(self.GetLong(index)) 
return math.Float64frombits(bits) 


最 后 是 引用 值 ， 也 比较 人 简单， 直接 存 取 即 
可 。 


func (self LocalVars) SetRef(index uint, ref *Object) { 
self[index].ref = ref 


} 
func (self LocalVars) GetRef(index uint) *Object { 
return self[index].ref 


请 读者 注意 ， 我 们 并 没有 真 的 对 boolean 、 
byte、short 和 char 类 型 定义 存 取 方 法 ， 这 些 类 型 的 
值 都 可 以 转换 成 int 值 类 来 处 理 。 下 面 我 们 来 实现 
操作 数 栈 。 


4.3.5 “操作 数 栈 


探 作 数 栈 的 实现 方式 和 局 部 变量 表 类 似 。 在 
ch04Nrtda 目 孙 下 创建 operand_stack.go 文 件 ， 在 其 
中 定义 OperandStack 结 构 体 ， 代 码 如 下 : 


package rtda 

import "math" 

type OperandStack struct { 
size Uint 
slots []Slot 

} 


操作 数 栈 的 大 小 是 编译 器 已 经 确定 的 ， 所 以 
可 以 用 []Slot 实 现 。size 字 段 用 于 记录 栈 顶 位 置 。 
继续 编辑 operand_stack.go， 在 其 中 实现 
newOperandStack () 函数 ， 代 码 如 下 : 


func newOperandStack(maxStack uint) *OperandStack { 
If maxStack > © { 
return &operandStackt{ 
slots: make([]1Slot, maxStack), 


} 


return nil 


} 


代码 也 比较 容 单 ， 在 此 束 不 多 解释 了 。 和 局 
部 变量 表 类 似 ， 需 要 定义 一 些 方法 从 操作 数 栈 中 
弹出 ， 或 者 往 其 中 推 入 各 种 类 型 的 变量 。 先 看 最 
简单 的 int 变 量 。 
func (self *OperandStack) PushInt(val int32) { 


self.slots[self.sizel].num = val 
self.sizet+ 


} 

func (self *OperandStack) PopInt() int32 { 
self.size-- 
return self.slots[self.sizel].num 


} 


PushInt () 方法 往 栈 顶 放 一 个 int 变 量 ， 人 然后 
把 size 加 1。PopInt () 方法 则 恰好 相反 ， 先 把 size 
减 1， 然 后 返回 变量 值 。float 变 量 还 是 先 转 成 int 类 


型 ， 然 后 按 int 变 量 处 理 。 


func (self *OperandStack) PushFloat(val float32) { 
bits := math.Float32bits(val) 
self.slots[self.sizel].num = int32(bits) 
self.sizet+ 


} 

func (self *OperandStack) PopFloat() float32 { 
self.size-- 
bits := uint32(self.slots[self.sizel].num) 
return math.Float32frombits(bits) 

} 


eh 
量 。 弹 出 时 ， 先 弹出 两 个 int 变 量 ， 然 后 组 装 成 一 


个 long 变 量 。 


func (self *OperandStack) PushLong(val int64) { 
self.slots[self.sizel.num = int32(val) 
self.slots[self.size+1].num = int32(val >> 32) 
self.size += 2 


} 

func (self *OperandStack) PopLong() int64 { 
self.size -= 2 
low := uint32(self.slots[self.sizel].num) 


high := uint32(self.slots[self.size+1].num) 
return int64(high)<<32 | int64(low) 


double 变 量 先 转 成 long 类 型 ， 然 后 按 l1ong 变 
处 理 。 


func (self *OperandStack) PushDouble(val float64) { 
bits := math.Float64bits(val) 
self.PushLong(int64(bits)) 


func (self *OperandStack) PopDouble() float64 { 
bits := uint64(self.PopLong()) 
return math.Float64frombits(bits) 


} 


最 后 看 引用 类 型 ， 代 码 如 下 : 


func (self *OperandStack) PushRef(ref *Object) { 
self.slots[self.sizel|.ref = ref 
self.sizet++ 


} 

func (self *OperandStack) PopRef() *Object { 
self.size-- 
ref := self.slots[self.sizel].ref 
self.slots[self.sizel|.ref = nil 
return ref 


} 


PushRef () 方法 比较 简单 ， 此 处 不 做 太 多 解 
pn () 方法 需要 说 明 一 点 : 弹出 引用 
， 把 Slot 结构 体 的 ref 字 段 设置 成 nm， 这 样 做 是 
为 了 帮助 Go 的 垃圾 收集 硕 回 收 Object 结构 体 实 
例 。 


人 至此， 局 部 变量 表 和 换 作 效 栈 都 准备 好 了 。 
仅 通 过 代码 来 理解 它们 可 能 不 是 很 直观 ， 下 面 我 
们 将 通过 一 个 具体 的 例 于 来 分 析 局 部 变量 表 和 操 
作 数 的 使 用 。 


4.3.6 局 部 变量 表 和 操作 数 栈 实例 分 析 


以 圆 形 的 周 长 公 式 为 例 进 行 分 机 ， 下 面 是 Java 
方法 的 代码 。 


public static float circumference(float r) { 
float pi = 3.14f; 
float area =2* pi * r,; 
return area; 


上 面 的 方法 会 被 javac 编 译 絮 编译 成 如 下 字 廊 
码 : 


00 ldc #4 
02 fstore 1 
03 fconst 2 
04 fload 1 
05 fmul 

06 fload 0 
07 fmul 

08 fstore 2 
09 fload 2 
10 return 


下 面 分 析 这 段子 扩 码 的 执行 。circumference 
() 方法 的 局 部 变量 表 大 小 是 3， 操 作 数 栈 深度 是 
2。 假 设 调用 方法 时 ， 传 递 给 它 的 参数 是 1.6f， 方 
法 开始 执行 前 ， 幅 的 状态 如 图 4-3 所 示 。 


Instruction Local Vars Operand Stack 
#0 #1 #2 bottom 
EE 


图 4-3 ”circumference () 方法 执行 示意 图 (1) 


第 一 条 指令 是 ldc， 它 把 3.14f 推 入 栈 顶 ， 如 图 
4-4 所 示 。 


Instructions Local Vars Operand Stack 
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图 4-4 circumference () 方法 执行 示意 图 (2) 


注意 ， 上 面 是 局 部 变量 表 和 操作 数 栈 过 去 的 
状态 ， 最 下 面 是 当前 状态 。 接 着 是 fstore_1 指 令 ， 
它 把 栈 顶 的 3.14f 弹 出 ， 放 到 #1 号 局 部 变量 中 ， 如 
图 4-5 所 示 。 


fconst_2 指 令 把 2.0f 推 到 栈 顶 ， 如 图 4-6 所 示 。 


Instructions Local Vars Operand Stack 
#0 #1 #2 bottom 
pe 


图 4-5 ”circumference () 方法 执行 示意 图 (3) 


Instructions Local Vars Operand Stack 
#0 #1 #2 bottom 


图 4-6 ”circumference () 方法 执行 示意 图 (4) 


fload_1 指 令 把 #1 号 局 部 变量 推 入 栈 页 ， 如 


4-7 所 示 。 


图 4-7 circumference () 方法 执行 示意 图 (5) 


fmul 指 令 执 行 浮 点 数 乘法 。 它 把 栈 顶 的 两 个 
浮 点 数 弹 出 ， 相 乘 ， 然 后 把 结果 推 入 栈 顶 ， 如 图 
4-8 所 示 。 


fload_0 指 令 把 #0 号 局 部 变量 推 入 栈 栅 ， 如 图 


4-9 所 示 。 
fmul 继 续 乘法 计算 ， 如 图 4-10 所 示 。 


fstore_2 指 令 把 控 作 数 栈 顶 的 float 值 弹出 ， 放 
入 # 相 号 局 部 变量 表 ， 如 图 4-11 所 示 。 
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图 4-8 ”circumference () 方法 执行 示意 图 (6) 
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图 4-10 
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图 4-11 circumference () 方法 执行 示意 图 (9) 


fload_2 指 令 把 #2 号 局 部 变量 推 入 操作 数 栈 
顶 ， 如 图 4-12 所 示 。 
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图 4-12 ”circumference () 方法 执行 示意 图 (10) 


最 后 freturn 指 令 把 操作 数 栈 顶 的 float 变 量 弹 
出 ， 返 回 给 方法 调用 者 ， 如 图 4-13 所 示 。 
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如 朱 上 面 的 例子 理解 起 来 有 点 困难 ， 请 不 要 
担心 。 这 里 重点 看 局 部 变量 表 和 操作 数 栈 的 用 法 
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图 4-13 


4.4 测试 本 章 代码 


本 看 侧 单 测试 局 部 变量 表 和 操作 数 栈 的 用 
法 ， 在 下 一 章 它 们 才 会 真正 派 上 用 场 。 打 开 
ch04\main.go 文 件 ， 修 改 import 语 句 ， 代 人 码 如 下 : 


package main 

import "fmt" 

import "jvmgo/cho4/rtda" 

func main() {...} 

func startJVM(cmd *Cmd) {...} 


main () 方法 不 变 ， 修 改 startJVM 方 法 ， 代 码 
如 下 : 


func startJVM(cmd *Cmd) { 
frame := rtda.NewFrame(100, 100) 
testLocalVars(frame.LocalVars()) 
testOperandStack(frame.Operandstack( ) ) 


testLocalVars () 函数 测试 局 部 变量 ， 代 人 码 如 
下 : 


func testLocalVars(vars rtda.LocalVars) { 
vars.SetInt(0, 100) 
vars.SetInt(1, -100) 
vars.SetLong(2, 2997924580) 
vars.SetLong(4, -2997924580) 
vars.SetFloat(6, 3.1415926) 
vars.SetDouble(7, 2.71828182845) 
vars.SetRef(9, nil) 
println(vars.GetInt(0)) 
println(vars.GetInt(1)) 
println(vars.GetLong(2)) 
println(vars.GetLong(4)) 
println(vars.GetFloat(6)) 
println(vars.GetDouble(7)) 
println(vars.GetRef(9)) 


testOperandStack () 函数 测试 探 作 数 栈 ， 代 
码 如 下 : 


func testOperandStack(ops *rtda.OperandSstack) { 
ops.PushInt(100) 
ops.PushInt(-100) 
ops.PushLong(2997924580) 
ops.PushLong(-2997924580) 
ops.PushFloat(3.1415926) 
ops.PushDouble(2.71828182845) 
ops .PushRef (nil) 
println(ops.PopRef()) 
println(ops.PopDouble( )) 


println(ops. ( 
println(ops. ) 
.PopLong() 
) 
) 


println(ops 


println(ops. 
println(ops. 


PopFloat 
PopLong ( 


) ) 
) 
) 
PopInt() 
PopInt() 


打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 章 


代码 : 


go install jvmgo\ch04 


编译 成 功 后 ， 在 D: \govworkspace\bin 目 永 下 
出 现 ch04.exe 文 件 。 执 行 ch04.exe， 运 行 结果 如 图 


4-14 所 示 。 


到 命令 提示 符 3 
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图 4-14 ”ch04.exe 的 运行 
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4.5 ”本章 小 结 


本 章 介绍 了 运行 时 数据 区 ， 初 步 实现 了 
Thread 、 Stack 、 Frame 、 OperandStack 和 和 LocalVars 
等 线程 私有 的 运行 时 数据 区 。 下 一 章 将 实现 字 节 
人 码 解释 占 ， 到 有 时候 万 法 束 可 以 在 我 们 的 Java 庶 拟 
机 里 运行 了 。 


第 5 章 ” 指 令 集 和 解释 骨 


由 第 3 半 可 知 ， 编 译 之 后 的 Java 方 法 以 字 市 码 
的 形式 存储 在 class 文 件 中 。 在 第 4 章 中 ， 初 步 实现 
了 Java 虚 拟 机 栈 、 巾 、 操 作 数 栈 和 局 部 变量 表 等 
运行 时 数据 区 。 本 章 将 在 前 两 章 的 基础 上 编写 一 
个 简单 的 解释 器 ， 并 且 实 现 大 约 150 条 指令 。 在 后 
面 的 章节 中 ， 会 不 断 改进 这 个 解释 右 ， 让 它 可 以 
执行 更 多 的 指令 。 


在 开始 阅读 本 章 之 前 ， 先 把 本 章 的 目录 结构 
准备 好 。 复 制 ch04 目 录 ， 改 名 为 ch05。 修 改 
main.go 等 文件 ， 把 import 语 句 中 的 ch04 都 改 成 
ch05。 在 ch05 目 录 中 创建 instructions 子 目录 。 现 在 
我 们 的 目 邓 结构 看 起 来 应 该 是 下 面 这 样 : 


D:\go\workspace\src 
|-jvmgo 
| -cho1 ~ cho4 
| -cho5 
|-classfile 
-classpath 
-instructions 


5.1 ” 字 节 人 友和 指令 集 


Java 虚 拟 机 顾名思义 ， 束 十 一 台 虚 拟 的 机 妖 ， 
而 字 节 码 (bytecode) 就 是 运行 在 这 台 虚 拟 机 右上 
的 机 需 码 。 我 们 已 经 知道 ， 每 一 个 类 或 者 接口 都 
会 被 Java 编 译 器 编译 成 一 个 class 文 件 ， 类 或 接口 的 
方法 信息 就 放 在 class 文 件 的 method_info 结 构 中 由 

。 如果 方法 不 是 抽象 的 ， 也 不 是 本 地 方法 ， 方 法 
的 Java 代 码 瓯 会 被 编译 丹 编 译 成 字 节 人 码 (即使 方法 
是 空 的 ， 编 译 右 也 会 生成 一 条 return 语 句 ) ， 存 放 
在 method_info 结 构 的 Code 属 性 中 。 仍 以 第 3 章 的 
ClassFileTest 类 为 例 ， 其 main () 方法 如 图 5-1 所 


一 


a 


ClassFileTest.class X 
pe 


v methods sy 
> #0: <init> 211 3 GF 75 4 O01 00 15 4C 6 61 76 61 2F 69 6F 
v #1: main 220| 2F 50 72 69 6€E 74 53 74 72 65 6€1 6D 3B 01 00 13 
accessFlags: ACC_PUBLIC, ACC_STATIC 人 村 
eindex #41->main 250| 28 4c A 61 76 61 2F 6C 61 6E 67 2F 53 74 72 69 


descriptorindex: #42->([Ljiava/lang/String;)y 2601 €E 67 3B 29 56 00 21 00 05 00 06 00 00 00 
270 9 NN ) 

naxt.ocalt. 1 2F0| 02 00 01 00 22 00 23 00 01 00 24 00 00 00 2F 00 

300 ] ] 和 00 00 0 05 2A B7 00 01 Bi 00 00 00 02 


) 0 2 00 24 00 00 00 37 00 02 00 01 

) 00 09 B29000020220030B69000040BY 00 00 00 

0 0 0A 00 02 00 00 00 OF 00 08 00 

attributesCount; 2 360 10 00 26 00 00 00 Oc 00 01 00 00 00 09 00 2B 00 

» attributes 3701 2C 00 00 00 2D 00 00 00 04 00 01 00 2E 00 01 00 
> #1 (EXCept 380| 2F 00 00 0 > 


图 5-1 用 classpy 观 罕 方 法 字 萎 码 


字 节 码 中 存放 编码 后 的 Java 虚 拟 机 指令 。 每 条 
令 都 以 一 个 单字 节 的 操作 码 (opcode) 开头 ， 
这 就 是 字 市 码 名 称 的 由 来 。 由 于 只 使 用 一 字 节 表 
示 操 作 码 ， 显 而 易 见 ，Java 虚 拟 机 最 多 只 能 支持 
256 (28 ) 条 指令 。 到 第 八 版 为 止 ，Java 虚 拟 机 规 
汇 已 经 定义 了 205 条 指令 ， 操 作 码 分 别 是 0 


(0x00) 到 202 (0xCA) 、254 (0xFE) 和 255 


(0xFF) 。 这 205 条 指令 构成 了 Java 虚 拟 机 的 指令 

集 (instruction set) 。 和 汇编 语言 类 似 ， 为 了 便于 
记忆 ，Java 虚 拟 机 规范 给 每 个 操作 码 都 指定 了 一 个 
助 记 符 (mnemonic) 。 比 如 操作 码 是 0x00 这 条 指 
令 ， 因 为 它 什么 也 不 做 ， 所 以 它 的 助 记 符 是 nop 


(no operation) 。 


Java 庶 拟 机 使 用 的 是 要 长 指令 ， 操 作 码 后 面 可 
以 跟 零 字 市 或 多 字 市 的 操作 数 (operand) 。 如 果 
把 指令 想象 成 范 数 的 话 ， 换 作 效 吏 是 它 的 参数 。 
为 了 让 编码 后 的 子 太 人 码 更 加 紧 泽 ， 很 多 控 作 人 码 本 
号 束 隐 舍 了 操作 数 ， 比 如 把 单数 0 推 入 哥 作 效 栈 的 
指令 征 iconst_ 0。 下 面 通过 具体 的 例 于 来 观 绎 Java 
虚拟 机 指令 。 图 5-2 为 ClassFileTest.main () 方法 


HI 


DOde 
0: getstatic #2->java/lang/System.out 


3 0 29 00 2A 00 02 00 24 00 00 00 37 00 02 00 01 

034 )0 00 00 09 B200002 12 03 B6 00 04 B1 00 00 00 
5 0 25 00 00 00 OA 00 02 00 00 00 OF ){ 
了 


10 00 26 00 00 0 
DC 0 00 0 


0330 | 

340 | 
0350 | 
0360 | 
0370| 
0380 | 


Zs UV UV UU 
pp Ne ) 
8 2 0 00 0 ( } 0 


图 5-2 ”用 classpy 观 察 getstatic 指 令 


可 以 看 到 ， 该 指令 的 操作 码 是 0xB2， 助 记 符 
是 getstatic。 它 的 控 作 数 古 0x0002， 代 表 第 量 池 里 


的 第 二 个 音量 。 


在 第 4 章 中 讨论 过 ， 操 作 数 栈 和 局 部 变量 表 只 
存放 数据 的 值 ， 并 不 记 孙 数据 类 型 。 结 来 束 是 : 
指令 必须 知道 日 己 在 操作 什么 类 型 的 数据 。 这 一 
扩 也 直接 反映 在 了 操作 人 码 的 助 记 符 上 。 例 如 ，iadd 
令 束 古 对 int 值 进行 加 法 操作 ;，dstore 指 令 把 操作 
数 栈 项 的 double 值 弹出 ， 和 存储 到 局 部 变量 表 中 ; 
areturmn 从 方法 中 返回 引用 值 。 也 就 古 说 ， 如 宋 攻 
类 指令 可 以 操作 不 同类 型 的 变量 ， 则 助 记 符 的 第 


一 个 字母 表示 变量 类 型 。 助 记 符 首 字 母 和 变量 类 
型 的 对 应 关系 如 表 5-1 所 示 。 


表 5-1 助 记 符 首 字 母 和 变量 类 型 对 应 表 


助 记 符 首 字母 数据 类 型 例子 
a reference aload 、astore 、areturn 
b byte/boolean bipush、baload 
© char caload、castore 
d double dload 、dstore 、dadd 
和 float fload、fstore、fadd 
i int iload 、istore 、iadd 
1 long load、lstore、ladd 
short sipush、sastore 


Java 虚 拟 机 规范 把 已 经 定义 的 205 条 指令 按 用 
途 分 成 了 11 类 ， 分 别 是 : 常量 (constants) 指令 、 
加 载 (loads) 指令 、 存 储 (stores) 指令 、 操 作 数 
栈 (stack) 指令 、 数 学 (math) 指令 、 转 换 

(conversions) 指令 、 比 较 (comparisons) 指 


令 、 控 制 (control) 指令 、 引 用 (references) 指 


必 


` 扩 展 (extended) 指令 和 保留 (reserved) 指 


必 


保留 指令 一 共有 3 条 。 其 中 一 条 是 留 给 调试 右 
的 ， 用 于 实现 断 点 ， 操 作 码 是 202 (0xCA) ， 助 
记 和 从 是 breakpoint。 为 外 两 条 留 给 Java 虚 拟 机 实现 
内 部 使 用 ， 操 作 码 分 别 是 254 (0xFE) 和 266 
(0xFF) ， 助 记 符 是 impdep1 和 impdep2。 这 三 条 
令 不 允许 出 现在 class 文 件 中 。 


本 章 将 要 实现 的 指令 涉及 11 类 中 的 9 类 。 在 第 
9 章 讨论 本 地 方法 调用 时 会 用 到 保留 指令 中 的 
impdep1 指 令 ，3| 用 指令 则 分 布 在 第 6、 第 7、 第 
8、 第 10 半 等 革 节 中 。 为 了 便于 管理 ， 我 们 把 每 种 
指令 的 源 文件 都 放 在 各 目的 包 里 ， 所 有 指令 都 共 


用 的 代码 则 放 在 base 包 里 。 因 此 ch0Sinstructions 目 
永 下 会 有 如 下 10 个 子 目 永 : 


D:\go\workspace\src 
|-jvmgo 
| -ch05 
|-classfile 
|-classpath 
|-rtda 
|-instructions 
-base 
-comparisons 
-constants 
-control 
-Conversions 
-extended 
-loads 
-math 
-Stack 
-Stores 


请 读 首先 创建 好 这 些 目录 。 


[如果 读者 已 经 扎 记 了 class 文 件 结构 ， 可 以 回 到 


第 3 章 复 习 。 


5.2 ”指令 和 指令 解码 


Java 庶 拟 机 规范 的 2.11 廊 介绍 耳 Java 虚拟 机 人 解 
释 希 的 大 致 下 辑 ， 如 下 所 示 : 


do { 
atomically calculate pc and fetch opcode at pc; 
if (operands) fetch operands; 
execute the action for the opcode; 

} while (there is more to do); 


每 次 循环 都 包含 三 个 部 分 : 计算 pc、 指 令 解 
码 、 指 令 执 行 。 可 以 把 这 个 逻辑 用 Go 语言 写成 一 
个 for 循 环 ， 里 面 是 个 大 大 的 switch-case 语 句 。 但 
这 样 的 话 ， 代 码 的 可 读 性 将 非常 差 。 所 以 采用 田 
外 一 种 方式 : 把 指令 抽象 成 授 口 ， 解 码 和 执行 你 
辑 写 在 具体 的 指令 实现 中 。 这 样 编写 出 的 解释 句 


束 和 Java 庶 拟 机 规范 里 的 伪 代 码 一 样 商 单 ， 代 码 
则 下 : 


for { 
pc := calculatePC() 
opcode := bytecode[pc] 
inst := createInst(opcode) 
inst.fetchoperands(bytecode ) 
Inst.execute( ) 


上 而 给 出 的 仍然 古 伪 代 码 。 将 在 5.12 太 编写 
解释 器 代码 ， 在 5.3~5.11 市 分 类 实现 具体 的 指令 。 
本 万 和 爷 定 义 指 令 授 口 ， 然 后 定义 一 个 结构 体 用 来 
铺 助 指令 解码 。 


5.2.1 Instruction 接 口 


在 ch05\instructions\base 目 录 下 创建 
instruction.go 文 件 ， 在 其 中 定义 mstruction 接 口 ， 
代码 如 下 : 


package base 

import "jvmgo/cho5/rtda" 

type Instruction interface { 
Fetchoperands(reader *BytecodeReader) 
Execute(frame *rtda.Franme) 


} 


FetchOperands () 方法 从 字 市 码 中 提取 操作 
数 ，Execute () 方法 执行 指令 逻辑 。 有 很 多 指令 
的 操作 数 都 古 类 似 的 。 为 了 避免 重复 代码 ， 按 照 
操作 数 类 型 定义 一 些 结构 体 ， 并 实现 
FetchOperands () 方法 。 这 相当 于 Java 中 的 抽象 


类 ， 有 具体 的 指令 继承 这 些 结构 体 ， 然 后 专注 实现 
Execute () 方法 即 可 。 


在 instruction.go 文 件 中 定义 
NoOperandsInstruction 结 构 体 ， 代 人 码 如 下 : 


type NoOperandsInstruction struct {} 


NoOperandsInstruction 表 示 没 有 操作 数 的 指 
令 ， 所 以 没有 定义 任何 字段 。FetchOperands () 
方法 目 然 也 是 空空 如 也 ， 什 么 也 不 用 读 ， 代 码 如 
下 : 


func (self *NoOperandsInstruction) Fetchoperands (reader 
*BytecodeReader) { 

// nothing to do 
} 


继续 编辑 instruction.go 文 件 ， 在 其 中 定义 
BranchInstruction 结 构 体 ， 代 码 如 下 : 


type BranchInstruction struct { 
offset int 


上 


BranchInstruction 表 示 跳 转 指令 ，Otffset 字 段 
存放 跳 转 偏 移 量 。FetchOperands () 方法 从 字 节 
码 中 读 取 一 个 uint16 整 效 ， 转 成 int 后 赋 给 Offset 字 
段 。 代 码 如 下 : 


func (self *BranchInstruction) FetchOperands(reader 
*BytecodeReader) { 

self.offset = int(reader.ReadIint16()) 
} 


继续 编辑 instruction.go 文 件 ， 在 其 中 定义 
Index8Instruction 结 构 体 ， 代 码 如 下 : 


type Index8Instruction struct { 
Index uint 


存储 和 加 载 类 指令 需要 根据 索引 存 取 局 部 变 
量 表 ， 索 引 由 单字 廊 控 作 数 给 出 。 把 这 类 指令 抽 
象 成 Index8Instruction 结 构 体 ， 用 Index 字 段 表 示 局 
部 变量 表 和 索引 。FetchOperands () 方法 从 字 节 码 
中 读 取 一 个 int8 整 数 ， 转 成 uint 后 炭 给 Index 字 段 。 
代码 如 下 : 


func (self *Index8Instruction) FetchOperands(reader 
*BytecodeReader) { 

self.Index = uint(reader.ReadUint8()) 
} 


最 后 在 instruction.go 文 件 中 定义 
Index16Instruction 结 构 体 ， 代 码 如 下 : 


type Index16Instruction struct { 
Index uint 
} 


有 一 些 指令 需要 访问 运行 时 常量 池 ， 常 量 池 
索引 由 两 字 广 操作 数 给 出 。 把 这 类 指令 抽象 成 
Index16Instruction 结 构 体 ， 用 Index 字 段 表 示 常 量 
池 索 3|。FetchOperands () 方法 从 字 节 码 中 读 取 
一 个 uint16 整 数 ， 转 成 uint 后 赋 给 Index 字 段 。 代 码 
如 下 : 


func (self *Index16Instruction) FetchOperands(reader 
*BytecodeReader) { 

self.Index = uint(reader.ReadUint16()) 
} 


指令 接口 和 “抽象 ”指令 定义 好 了 ， 下 面 来 看 
BytecodeReader 结 构 体 。 


5.2.2 BytecodeReader 


在 ch05\instructions\base 目 杂 下 创建 
bytecode_reader go 文件 ， 在 其 中 定义 
BytecodeReader 结 构 体 ， 代 人 码 如 下 : 


package base 

type BytecodeReader struct { 
code [jbyte 
pc int 


} 


code 子 段 存 放 字 太 码 ，pc 子 段 记 了 采 读 取 人 到 了 
哪个 字 玫 。 为 了 避免 每 次 解码 指令 者 新 创建 一 个 
BytecodeReader 实 例 ， 给 它 定 义 一 个 Reset () 方 
法 ， 代 码 如 下 : 


func (self *BytecodeReader) Reset(code [|]byte, pc int) { 
self.code = code 
self.pc = pc 


下 面 实 现 一 系列 的 Read () 方法 。 先 看 最 简 
单 的 ReadUint8 () 方法 ， 代 码 如 下 : 


func (self *BytecodeReader) ReadUint8() uint8 { 
i := self.code[self.pcl] 
self .pc++ 
return i 


} 


ReadInt8 () 方法 调用 ReadUint8 () ， 然 后 
把 读 取 到 的 值 转 成 int8 返 回 ， 代 人 码 如 下 : 


func (self *BytecodeReader) ReadInt8() int8 { 
return int8(self.ReadUint8()) 
} 


ReadUint16 () 连续 读 取 两 字 节 ， 代 码 如 
下 : 


func (self *BytecodeReader) ReadUint16() uint16 { 
byte1 := uint16(self.ReadUint8()) 
byte2 := uint16(self.ReadUint8()) 
return (byte1 << 8) | byte2 

} 


ReadInt16 () 方法 调用 ReadUint16 () ， 然 
后 把 读 取 到 的 值 转 成 int16 返 回 ， 代 码 如 下 : 


func (self *BytecodeReader ) ReadInt16() int16 { 
return int16(self.ReadUint16()) 
} 


ReadInt32 () 方法 连续 读 取 4 字 节 ， 代 人 码 如 
下 : 


func (self *BytecodeReader) ReadInt32() int32 { 

byte1 := int32(self.ReadUint8()) 

byte2 := int32(self.ReadUint8()) 

byte3 := int32(self.ReadUint8()) 

byte4 := int32(self.ReadUint8()) 

return (byte1 << 24) | (byte2 << 16) | (byte3 << 8) | 
byte4 
} 


还 需要 定义 两 个 方法 : ReadInt32s () 和 
SkipPadding () 。 这 两 个 方法 只 有 tableswitch 和 
lookupswitch 指 令 使 用 ， 介 绍 这 两 条 指令 时 再 给 


代码 。 


在 接 下 来 的 9 个 小 让 中 ， 将 按照 分 类 依次 实现 
约 150 条 指令 ， 占 整个 指令 集 的 3/4。 读 者 干 万 不 
要 被 150 这 个 数字 吓 倒 ， 因 为 很 多 指令 其 实 是 非常 
相似 的 。 比 如 iload、lload、fload、dload 和 aload 这 
5 条 指令 ， 除 了 操作 的 数据 类 型 不 同 以 外 ， 代 码 几 
平一 样 。 再 比如 iload_0、iload_1、iload 2 和 
iload_3 这 四 条 指令 ， 只 是 iload 指 令 的 特例 (局 部 
变量 表 索 引 隐 售 在 操作 码 中 ) ， 操 作 逻 辑 完 全 一 
样 。 


如 朱 逐 一 列 出 这 150 余 条 指令 的 代码 ， 既 梧 燥 
之 味 ， 也 相当 痕 费 纸张 。 为 了 太 约 篇 幅 ， 只 讨论 
一 些 具有 代表 意义 的 指令 的 实现 代码 ， 从 这 些 指 
令 可 以 很 容易 想象 到 其 他 指令 的 实现 。 附 永 A 给 
出 了 完整 的 指令 集 列表 ， 里 面 有 每 个 指令 的 操作 


码 、 助 记 符 和 本 书 中 实现 它们 的 章节 ， 以 方便 读 


5.3 向量 指令 

常量 指令 把 常量 推 入 操作 数 栈 顶 。 常 量 可 以 
来 自 三 个 地 方 ， 隐 含 在 操作 码 里 、 操 作 数 和 运行 
令 共有 21 条 ， 本 节 实 现 其 中 的 
18 条 。 另 外 3 条 是 ldc 系 列 指令 ， 用 于 从 运行 时 党 
量 池 中 加 载 常量 ， 将 在 第 6 章 介 绍 。 


5.3.1 ”nop 指令 


nop 指 令 是 最 人 简单 的 一 条 指令 ， 因 为 它 什 么 也 
不 做 。 在 ch05\instructions\constants 目 录 下 创建 
nop.go 文 件 ， 在 其 中 实现 nop 指 令 ， 代 码 如 下 : 


package constants 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/choO5/rtda" 

// Do nothing 

type NOP struct{ base.NoOperandsInstruction } 

func (self *NOP) Execute(frame *rtda.Frame) { 
// 什么 也 不 用 做 


5.3.2 const 系 列 指令 


这 一 系列 指令 把 隐 售 在 操作 码 中 的 篆 量 值 推 
入 操作 数 栈 顶 。 在 ch05NinstructionsN\constants 目 永 
下 创建 const.go 文 件 ， 和 在 其 中 定义 15 条 指令 ， 代 三 


如 下 : 


package constants 
import "jvmgo/chO5/instructions/base" 
import "jvmgo/choO5/rtda" 


type ACONST_NULL struct{ base.NoOperandsInstruction } 


type 
type 
type 
type 
type 


DCONST_ 0 struct{ base. 
DCONST_1 struct{ base. 
FCONST_ 0 struct{ base. 
FCONST_1 struct{ base. 
FCONST_2 struct{ base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


HI 


type ICONST_M1 struct{ base.NoOperandsInstruction } 


type 
type 
type 
type 
type 
type 
type 
type 


ICONST_0O 
ICONST_1 
ICONST_2 
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NoOperandsInstruction 
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OA 


以 3 条 指令 为 例 进 行 说 明 。aconst_null 指 令 把 
nul 引 用 推 入 操作 数 栈 顶 ， 代 码 如 下 : 


func (self *ACONST_NULL) Execute(frame *rtda.Frame) { 
frame.OperandStack().PushRrRef (nil) 
} 


dconst_ 0 指令 把 double 型 0 推 入 操作 数 栈 顶 ， 
代码 如 下 : 


func (self *DCONST_ 0) Execute(frame *rtda.Frame) { 
frame.OperandSstack().PushDouble(0.0) 
} 


iconst_m1 指 令 把 int 型 -1 推 入 操作 数 栈 顶 ， 代 
但 如 下 : 


func (self *ICONST_M1) Execute(frame *rtda.Frame) { 


frame.OperandSstack().PushIint(-1) 
} 


5.3.3 ”bipush 和 和 sipush 指 令 


bipush 指 令 从 操作 数 中 获取 一 个 byte 型 整数 ， 
扩展 成 nt 型， 然后 推 入 栈 项 。sipush 指 令 从 操作 
效 中 获取 一 个 short 型 整 效 ， 扩 展 成 int 型 ， 然 后 推 
入 栈 顶 。 在 ch05\instructions\constants 目 录 下 创建 
ipush.go 文 件 ， 在 其 中 定义 bipush 和 sipush 指 令 ， 
代码 如 下 : 


package constants 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/cho5/rtda" 

type BIPUSH struct { val int8 } // Push byte 
type SIPUSH struct { val int16 } // Push Short 


以 bipush 指 令 为 例 ，FetchOperands () 和 
Execute () 方法 的 代码 如 下 : 


func (self *BIPUSH) Fetchoperands (reader 
*base.BytecodeReader) { 


self.val = reader .ReadInt8() 

} 

func (self *BIPUSH) Execute(frame *rtda.Frame) { 
i := int32(self.val) 
frame.OperandSstack().PushInt(i) 


5.4 “加载 指令 


加 载 指 令 从 局 部 变量 表 获 取 变 量 ， 然 后 推 入 
操作 数 栈 顶 。 加 载 指令 共 33 条 ， 按 照 所 操作 变量 
的 类 型 可 以 分 为 6 类 : aload 系 列 指令 操作 引用 类 
型 变量 、dload 系 列 操作 double 类 型 变量 、fload 系 
列 操作 float 变 量 、iload 系 列 操作 int 变 量 、lload 系 
列 操作 long 变 量 、xaload 操 作 数 组 。 本 世 实 现 其 中 
的 25 条 ， 数 组 和 xaload 系 列 指令 将 在 第 8 章 讨 论 。 
下 面 以 iload 系 列 为 例 介绍 加 载 指 令 。 


在 ch0SNinstructions\oads 目 孙 下 创建 iload.go 文 
件 ， 在 其 中 定义 5 条 指令 ， 代 人 码 如 下 : 


package loads 

import "jvmgo/chO5/instructions/base" 
import "jvmgo/chO5/rtda" 

// Load int from local variable 


type ILOAD struct{ base.Index8Instruction } 

type ILOAD 0 struct{ base.NoOperandsInstruction 
type ILOAD_ 1 struct{ base.NoOperandsInstruction 
type ILOAD 2 struct{ base.NoOperandsInstruction 
type ILOAD_ 3 struct{ base.NoOperandsInstruction 
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为 了 避免 重复 代码 ， 定 义 一 个 男 数 供 iload 系 
列 指令 使 用 ， 代 码 如 下 : 


func _iload(frame *rtda.Frame, index uint) { 
val := frame.LocalVars().GetIint(index) 
frame.OperandStack().PushIint(val) 


iload 指 令 的 索引 来 自 操作 数 ， 其 Execute () 
方法 如 下 : 


func (self *ILOAD) Execute(frame *rtda.Frame) { 
_iload(frame, uint(self.Index)) 


其 余 4 条 指令 的 索引 隐 售 在 操作 码 中 ， 以 
iload 1 为 例 ， 其 Execute () 方法 如 下 : 


func (self *ILOAD 1) Execute(frame *rtda.Frame) { 
_iload(frame, 1) 


} 


5.5 存储 指令 


和 加 载 指令 刚 好 相反 ， 存 储 指令 把 变量 从 操 
作 数 栈 顶 弹出 ， 然 后 存 入 局 部 变量 表 。 和 加 载 指 
令 一 样 ， 和 存储 指令 也 可 以 分 为 6 类 。 以 lstore 系 列 
指令 为 例 进行 介绍 。 在 ch05\instructions\stores 目 录 
下 创建 lstore.go 文 件 ， 在 其 中 定义 5 条 指令 ， 代 码 
如 下 : 


package stores 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

// Store long into local variable 

type LSTORE struct{ base.Index8Instruction } 
type LSTORE_© struct{ base.NoOperandsInstruction 
type LSTORE 1 struct{ base.NoOperandsInstruction 
type LSTORE_2 struct{ base.NoOperandsInstruction 
type LSTORE_ 3 struct{ base.NoOperandsInstruction 
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同样 定义 一 个 函数 供 5 条 指令 使 用 ， 代 码 如 
下 : 


func _lstore(frame *rtda.Frame, index uint) { 
val := frame.OperandStack().PopLong() 
frame.LocalVars().SetLong(index, val) 


lstore 指 令 的 索引 来 目 操 作 数 ， 其 Execute () 
方法 如 下 : 


func (self *LSTORE) Execute(frame *rtda.Frame) { 
_lstore(frame, uint(self.Index)) 


其 余 4 条 指令 的 索引 隐 舍 在 操作 码 中 ， 以 
]store 2 为 例 ， 其 Execute () 方法 如 下 : 


func (self *LSTORE_ 2) Execute(frame *rtda.Frame) { 
_lstore(frame, 2 


5.6 ” 栈 指 令 


栈 指 令 直 授 对 操作 数 栈 进行 控 作 ， 共 9 条 : 
pop 和 pop2 指 令 将 栈 顶 变量 弹出 ，dup 系 列 指令 复 
制 栈 项 变量 ，swap 指 令 交 换 栈 顶 的 两 个 变量 。 


和 其 他 类 型 的 指令 不 同 ， 栈 指令 并 不 关心 变 
量 类 型 。 为 了 实现 栈 指令 ， 需 要 给 OperandStack 
结构 体 添 加 两 个 方法 。 打 开 
ch05\rtda\operand_stack.go 文 件 ， 在 其 中 定义 
PushSlot () 和 PopSlot () 方法 ， 代 码 如 下 : 


func (self *OperandStack) PushSlot(slot Slot) { 
self.slots[self.sizel] = slot 
self.sizet++ 


} 

func (self *OperandStack) PopSlot() Slot { 
self.size-- 
return self.slots[self.sizel] 


} 


5.6.1 pop 和 pop2 指 令 


在 ch0OS\instructions\stack 目 如下 创建 pop.go 文 
件 ， 在 其 中 定义 pop 和 pop2 指 令 ， 代 人 码 如 下 : 


package stack 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/cho5/rtda" 

type POP struct{ base.NoOperandsInstruction } 
type POP2 struct{ base.NoOperandsInstruction } 


pop 指 令 把 栈 顶 变量 弹出 ， 代 码 如 下 : 


func (self *POP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
stack.PopSlot() 

} 


pop 指 令 只 能 用 于 弹出 int、float 等 占用 一 个 探 
作 数 栈 位置 的 变量 。double 和 long 变 量 在 操作 数 栈 


中 占据 两 个 位 置 ， 需 要 使 用 pop2 指 令 弹 出 ， 代 码 
则 下 


func (self *POP2) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
stack.PopSlot() 
stack.PopSlot() 

} 


5.6.2 ”dup 指 令 


在 ch0SNinstructions\stack 目 孙 下 创建 dup.go 文 
件 ， 在 其 中 定义 6 条 指令 ， 代 码 如 下 : 


package stack 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/cho5/rtda" 

type DUP struct{ base.NoOperandsInstruction } 
type DUP_X1 struct{ base.NoOperandsInstruction } 
type DUP_X2 struct{ base.NoOperandsInstruction } 
type DUP2 struct{ base.NoOperandsInstruction } 
type DUP2 Xx1 struct{ base.NoOperandsInstruction } 
type DUP2 Xx2 struct{ base.NoOperandsInstruction } 


dup 指 令 复 制 栈 顶 的 单个 变量 ， 代 码 如 下 : 


func (self *DUP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
slot := stack.PopSlot() 
stack.PushSlot(slot) 
stack.PushSlot(slot) 


其 他 5 条 指令 和 dup 指 令 还 是 有 一 定 老 别 的 ， 
里 惑 不 具体 介绍 了 ， 请 读者 阅读 随 书 源 代 码 。 


5.6.3 ”swap 指令 


在 ch0OS\instructions\stack 目 录 下 创建 swap.go 文 
件 ， 在 其 中 定义 swap 指 令 ， 代 码 如 下 : 


package stack 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/cho5/rtda" 

// Swap the top two operand stack values 

type SWAP struct{ base.NoOperandsInstruction } 


swap 指 令 交 换 栈 顶 的 两 个 变量 ，Execute () 


方法 如 下 : 


func (self *SWAP) Execute(frame *rtda.Frame) { 
stack frame.Operandstack() 
slot1 stack.PopSlot() 
slot2 := stack.PopSlot() 
stack.PushSlot(slot1) 
stack.PushSlot(slot2) 


数学 指令 大 致 对 应 Java 语 言 中 的 加 、 减 、 
放学 运算 符 。 效 学 指令 包括 算术 指令 、 
等 ， 共 


位 移 指令 和 布尔 运算 指令 等 ， 共 37 条 ， 将 全 部 在 


5.7.1 ”算术 指令 


算术 指令 又 可 以 进一步 分 为 加 法 (add) 指 
令 、 减 法 (sub) 指令 、 乘 法 (mul) 指令 、 除 法 
(div) 指令 、 求 余 (rem) 指令 和 取 反 (neg) 指 
令 6 种 。 加 、 减 、 乘 、 除 和 取 反 指令 都 比较 简单 ， 
本 节 以 稍微 复杂 一 些 的 求 余 指 令 为 例 进 行 讨论 。 


在 ch05\instructions\math 目 条 下 创建 rem.go 文 
件 ， 在 其 中 定义 4 条 求 余 指令 ， 代 码 如 下 : 


package math 

import "math" 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

type DREM struct{ base.NoOperandsInstruction 
type FREM struct{ base.NoOperandsInstruction 
type IREM struct{ base.NoOperandsInstruction 
type LREM struct{ base.NoOperandsInstruction 
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irem 和 lrem 代 人 码 闫 不 多 ， 以 irem 为 例 ， 
Execute () 方法 如 下 : 


func (self *IREM) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
if v2 == 0 { 
panic("java.lang.ArithmeticException: / by zero") 


result := v1 % v2 
stack.PushIint(result) 


完 从 操作 数 栈 中 弹出 两 个 int 变 量 ， 求 余 ， 然 
后 把 结 采 推 入 操作 数 栈 。 这 里 注意 一 点 ， 对 int 或 
long 变 量 做 除法 和 求 余 运算 时 ， 征 有 可 能 抛 出 
ArithmeticException 异 名 的 。frem 和 drem 指 令 关 不 
多 ， 以 drem 为 例 ， 其 Execute () 方法 如 下 : 


func (self *DREM) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
V2 := stack.PopDouble() 
v1 := stack.PopDouble() 
result := math.Mod(vi, v2) 
stack.PushDouble(result) 


Go 语言 没有 给 浮 点 效 类 型 定义 求 余 操作 符 
所 以 需要 使 用 math 包 的 Mod () 函数 。 男 外 ， 浮 
点 数 类 型 因为 有 Infinity (无 穷 大 ) 值 ， 所 以 即使 
除 零 ， 也 不 会 导致 ArithmeticException 有 异常 抛 


日 
人 
出 。 


5.7.2 ”位 移 指 令 


位 移 指令 可 以 分 为 下 移 和 石 移 两 种 ， 右 移 指 
令 又 可 以 分 为 算术 右 移 (有 符号 右 移 ) 和 逻辑 右 
移 (无 符号 右 移 ) 两 种 。 算 术 右 移 和 逻辑 位 移 的 
区 别 仅 在 于 符号 位 的 扩展 ， 如 下 面 的 Java 代 码 所 
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int x = -1; 
println(Integer.toBinaryString(x)); // 
11111111111111111111111111111111 
println(Integer.toBinaryString(x >> 8)); // 
11111111111111111111111111111111 
println(Integer.toBinaryString(x >>> 8)); // 
O00000000111111111111111111111111 


在 ch05\instructions\math 目 隶 下 创建 sh.go 文 
件 ， 在 其 中 定义 6 条 位 移 指令 ， 代 码 如 下 : 


package math 
import "jvmgo/chO5/instructions/base" 
import "jvmgo/chO5/rtda" 


type ISHL struct{ base.NoOperandsInstruction } // int 左 位 
移 


type ISHR struct{ base.NoOperandsInstruction } // int 算 术 
右 位 移 


type IUSHR struct{ base.NoOperandsInstruction } // int 逻 辑 
右 位 移 


type LSHL struct{ base.NoOperandsInstruction } // long 左 位 
移 


type LSHR struct{ base.NoOperandsInstruction } // long 算 术 
右 位 移 


type LUSHR struct{ base.NoOperandsInstruction } // long 逻 
辑 右 位 移 


左 移 指 令 比 较 简 单 ， 以 ishl 指 令 为 例 ， 其 
Execute () 方法 如 下 : 


func (self *ISHL) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
S := Uint32(v2) & Ox1f 
result := v1 << s 
stack.PushIint(result) 


完 从 操作 数 栈 中 弹出 两 个 int 变 量 vV2 和 v1 。v1 
是 要 进行 位 移 操 作 的 变量 ，v2 指 出 要 移 位 多 少 比 
符 。 位 移 之 后 ， 把 结果 推 入 操作 数 栈 。 这 里 注意 
两 点 : 第 一 ，int 变 量 只 有 32 位 ， 所 以 只 取 v2 的 前 5 
个 比特 丈 足 够 表示 位 移 位 数 了 ; 第 二 ，Go 语 言 位 
移 操 作 符 右 侧 必 须 是 无 符号 整数 ， 所 以 需要 对 v2 
进行 类 型 转换 。 


算术 右 移 指 令 需 要 扩展 符号 位 ， 代 码 和 左 移 
指令 基本 上 差不多 。 以 lshr 指 令 为 例 ， 其 Execute 
(TE 


func (self *LSHR) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopLong() 
S := Uint32(v2) & Ox3f 
result := v1 >> s 
stack.PushLong(result) 


long 变 量 有 64 位 ， 所 以 取 v2 的 前 6 个 比特 。 最 
后 以 iushr 为 例 ， 介 绍 逻 辑 石 移 指令 是 如 何 实现 
的 。 


func (self *IUSHR) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
S := Uint32(v2) & Ox1f 
result := int32(uint32(v1i) >> s) 
stack.PushIint(result) 


Go 语言 并 没有 Java 语 言 中 的 >>> 运 算 伯 ， 为 
了 达到 无 符号 位 移 的 目的 ， 需 要 先 把 v1 转 成 无 符 
号 整数， 位 移 操 作 之 后 ， 再 转 回 有 符号 整数 。 


5.7.3 布尔 运算 指令 


布尔 运算 指令 只 能 操作 int 和 long 变 量 ， 分 为 
按 位 与 (and) 、 按 位 或 (or) 、 按 位 异 或 
(xor) 3 种 。 以 按 位 与 为 例 介绍 布尔 运算 指令 
在 ch0SNinstructions\math 目 孙 下 创建 and.go 文 件 ， 
在 其 中 定义 jiand 和 land 指 令 ， 代 码 如 下 : 


package math 

import "jvmgo/cho5/instructions/base" 

import "jvmgo/chO5/rtda" 

type IAND struct{ base.NoOperandsInstruction } 
type LAND struct{ base.NoOperandsInstruction } 


以 iand 指 令 为 例 ， 其 Execute () 方法 如 下 : 


func (self *IAND) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopInt() 
v1 := stack.PopInt() 
result := v1 & v2 
stack.PushIint(result) 


代码 比较 休 单 ， 束 不 多 解释 了 。 


5.7.4 ”iinc 指 令 


iinc 指 令 给 局 部 变量 表 中 的 int 变 量 增 加 闸 量 
值 ， 局 部 变量 表 索 3 引 和 和 常量 值 部 由 指令 的 控 作 数 
提供 。 在 ch05\instructions\math 目 录 下 创建 iinc.go 
文件 ， 在 其 中 定义 iinc 指 令 ， 代 码 如 下 : 


package math 
import "jvmgo/chO5/instructions/base" 
import "jvmgo/choO5/rtda" 
// Increment local variable by constant 
type IINC struct { 

Index uint 

Const int32 
} 


FetchOperands () 辑 数 从 字 节 码 里 读 取 操作 
数 ， 代 码 如 下 : 


func (self *IINC) Fetchoperands(reader *base.BytecodeReader) 


self.Index 
self.Const 


} 


uint(reader .ReadUint8()) 
int32(reader .ReadInt8() ) 


Execute () 方法 从 局 部 变量 表 中 读 取 变量 ， 
给 它 加 上 第 量 值 ， 再 把 结 来 写 回 局 部 变量 表 ， 代 
人 码 如 下 : 


func (self *IINC) Execute(frame *rtda.Frame) { 
localVars := frame.LocalVars() 
val := localVars.GetInt(self.Index) 
val += self.Const 
localVars.SetIint(self.Index, val) 


5.8 关于 入 换 有 一 


类 型 转换 指令 大 致 对 应 Java 语 言 中 的 基本 类 
型 强制 转换 操作 。 类 型 转换 指令 有 共 15 条 ， 将 全 
部 在 本 和 实现 。 引 用 类 型 转换 对 应 的 是 checkcast 


指令 ， 将 在 第 6 章 介绍 。 


按照 被 转换 变量 的 类 型 ， 类 型 转换 指令 可 以 
分 为 3 种 : i2x 系 列 指令 把 int 变 量 强制 转换 成 其 他 
类 型 ，12x 系 列 指令 把 long 变 量 强制 转换 成 其 他 类 
型 ，f2x 系 列 指令 把 float 变 量 强 制 转换 成 其 他 类 


型 ，d2x 系 列 指令 把 double 变 量 强 制 转换 成 其 他 类 
型 。 以 d2x 系 列 指令 为 例 进 行 讨论 。 


在 ch05\instructions\conversions 目 录 下 创建 
d2x.go 文 件 ， 在 其 中 定义 d2f、d2i 和 d21 指 令 ， 代 


人 码 如 下 : 


package conversions 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

type D2F struct{ base.NoOperandsInstruction } 
type D2I struct{ base.NoOperandsInstruction } 
type D2L struct{ base.NoOperandsInstruction } 


以 d2i 指 令 为 例 ， 它 的 Execute () 方法 如 下 : 


func (self *D2I) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
d := stack.PopDouble() 
i := int32(d) 
stack.PushIint(i) 


因为 Go 语言 可 以 很 方便 地 转换 各 种 基本 类 型 
的 变量 ， 所 以 类 型 转换 指令 实现 起 来 还 是 比较 容 


易 的 。 
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比较 指令 可 以 分 为 两 类 : 一 类 将 比较 结果 推 
入 操作 数 栈 项 ， 一 类 根据 比较 结果 跳 转 。 比 较 指 
令 是 编译 器 实现 认 else、for、while 等 语句 的 基 


石 ， 共 有 19 条 ， 将 全 部 在 本 万 实现 。 


5.9.1 lcmp 指 令 


lcmp 指 令 用 于 比较 long 变 量 。 在 
ch05\instructions\comparisons 目 杂 下 创建 lcmp.go 文 
件 ， 在 其 中 定义 lemp 指 令 ， 代 码 如 下 : 


package comparisons 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

// Compare long 

type LCMP struct{ base.NoOperandsInstruction } 


Execute () 方法 把 栈 顶 的 两 个 long 变 量 弹 
出 ， 进 行 比较 ， 然 后 把 比较 结果 (int 型 0、1 
或 -1) 推 入 栈 顶 ， 代 码 如 下 : 


func (self *LCMP) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
v2 := stack.PopLong() 
v1 := stack.PopLong() 
if vi > v2 
stack.PushIint(1) 
} else if vi == v2 { 
stack.PushIint(0) 


} else { 
stack.PushIint(-1) 
} 


Se , fcmp<op> 和 dcmp<op> 指 令 


fcmpg 和 fcmpl 指 令 用 于 比较 float 变 量 。 在 
ch05Ninstructions\comparisons 目 孙 下 创建 fcmp.go 文 
件 ， 和 在 其 中 定义 fcmpg 和 fcmpl 指 令 ， 人 代码 如 下 : 


package comparisons 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

// Compare float 

type FCMPG struct{ base.NoOperandsInstruction } 
type FCMPL struct{ base.NoOperandsInstruction } 


这 两 条 指令 和 lcmp 指 令 很 像 ， 但 是 除了 比较 
的 变量 类 型 不 同 以 外 ， 还 有 一 个 重要 的 区 别 。 由 
于 浮 点 数 计算 有 可 能 产生 NaN (Nota Number) 
值 ， 所 以 比较 两 个 浮 点 数 时 ， 除 了 大 于 、 等 于 、 
小 于 之 外 ， 还 有 第 4 种 结果 : 无 法 比较 。fcmpg 和 


fcmpl 指 令 的 区 别 束 在 于 对 第 4 种 结 来 的 定义 
写 一 个 国 数 来 统一 比较 float 变 量 ， 代 人 码 如 下 : 


func _fcmp(frame *rtda.Frame, gFlag bool) { 

stack := frame.OperandStack() 

v2 := stack.PopFloat() 

v1 := stack.PopFloat() 

if vi > v2 f{ 
stack.PushIint(1) 

} else if vi == v2 { 
stack.PushIint(0) 

} else if vi < v2 1 
stack.PushInt(-1) 

} else if gFlag { 
stack.PushIint(1) 

} else { 
stack.PushInt(-1) 

} 


fcmpg 和 fcmpl 指 令 的 Execute () 方法 只 
单 地 调用 _fcmp () 画 数 而 已 ， 代 码 如 下 : 


func (self *FCMPG) Execute(frame *rtda.Frame) { 
_fcmp(frame, true) 


} 
func (self *FCMPL) Execute(frame *rtda.Frame) { 
_fcmp(frame, false) 


} 


, 编 


日 生生 
正则 


也 就 是 说 ， 当 两 个 float 变 量 中 至 少 有 一 个 是 
NaNH 时 ， 用 fcmpg 指 令 比 较 的 结 采 是 1， 而 用 fempl 
日 令 比较 的 结果 是 -1。 


dcmpg 和 dcmpl 指 令 用 来 比较 double 变 量 ， 在 
dcmp.go 文 件 中 ， 这 两 条 指令 和 fcmpg、fcmpl 指 令 
除了 比较 的 变量 类 型 不 同 之 外 ， 代 码 基本 上 完全 
一 样 ， 这 里 驶 不 详细 介绍 了 。 


5.9.3 “if<cond> 指 令 


在 ch05\instructions\comparisons 目 杂 下 创建 
ifcond.go 文 件 ， 在 其 中 定义 6 条 if<cond> 指 令 ， 代 
码 如 下 : 


package comparisons 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

// Branch if int comparison with zero succeeds 

type IFEQ struct{ base.BranchInstruction 

type IFNE struct{ base.BranchInstruction } 

type IFLT struct{ base.BranchInstruction } 

type IFLE struct{ base.BranchInstruction } 
} 
小 


ww 


type IFGT struct{ base.BranchInstruction 
type IFGE struct{ base,BranchInstruction 


if<cond> 指 令 把 操作 数 栈 顶 的 int 变 量 弹 出 ， 
然后 跟 0 进 行 比较 ， 满 足 条 件 则 跳 转 。 假 设 从 栈 顶 
弹出 的 变量 是 x， 则 指令 执行 跳 转 操作 的 条 件 如 
下 : 


"ifeq: x==0 


‘ifne: x! =0 


iflt: x<0 
"ifle: x<=0 
“ifgt: x>0 
"ifge: x>=0 


以 ifeq 指 令 为 例 ， 其 Execute () 方法 如 下 : 


func (self *IFEQ) Execute(frame *rtda.Frame) { 
val := frame.OperandStack().PopInt() 
if val == © { 
base.Branch(frame, self.offset) 
} 
} 


真正 的 跳 转 逻辑 在 Branch () 函数 中 。 因 为 
这 个 函数 在 很 多 指令 中 都 会 用 到 ， 所 以 把 它 定 义 
在 ch05\instructions\base\branch_logic.go 文 件 中 ， 
代码 如 下 : 


package base 

import "jvmgo/chO5/rtda" 

func Branch(frame *rtda.Frame, offset int) { 
pc := frame.Thread().PC() 
nextPC := pc + offset 
frame.SetNextPC(nextPC) 


Frame 结 构 体 的 SetNextPC () 方法 将 在 5.12 


< 


5.9.4 放 icmp<cond> 指 令 


在 ch05\instructions\comparisons 目 杂 下 创建 
if_icmp.go 文 件 ， 在 其 中 定义 6 条 if_icmp 指 令 ， 代 
他 如下: 


package comparisons 
import "jvmgo/chO5/instructions/base" 
import "jvmgo/choO5/rtda" 

// Branch if int comparison 


type 
type 
type 
type 
type 
type 


IF_ICMPEQ 
IF_ICMPNE 
IF_ICMPLT 
IF_ICMPLE 
IF_ICMPGT 
IF_ICMPGE 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 


succeeds 

BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 
BranchInstruction 


I I 


if_icmp<cond> 指 令 把 栈 顶 的 两 个 int 变 量 弹 
出 ， 然 后 进行 比较 ， 满 足 条 件 则 跳 转 。 跳 转 条 件 
和 if<cond> 指 令 类 似 。 以 if_icmpne 指 令 为 例 ， 其 
Execute () 方法 如 下 : 


func (self *IF_ICMPNE) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
val2 := stack.PopInt() 
val1i := stack.PopInt() 
If vali != val2 { 
base.Branch(frame, self.offset) 


5.9.5 放 acmp<cond> 指 令 


在 ch05\instructions\comparisons 目 杂 下 创建 
if_acmp.go 文 件 ， 在 其 中 定义 两 条 if_acmp<cond> 
指令 ， 代 码 如 下 : 


package comparisons 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/choO5/rtda" 

// Branch if reference comparison succeeds 

type IF_ACMPEQ struct{ base.BranchInstruction } 
type IF_ACMPNE struct{ base.BranchInstruction } 


if_acmpeq 和 if_acmpne 指 令 把 栈 顶 的 两 个 引用 
弹出 ， 根 据 引 用 是 否 相 同 进行 跳 转 。 以 if_acmpeq 
指令 为 例 ， 其 Execute () 方法 如 下 : 


func (self *IF_ACMPEQ) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
ref2 := Stack.PopRef() 
ref1 := Stack.PopRef() 
if ref1 == ref2 { 
base.Branch(frame, self.offset) 


5.10 ”控制 指令 


控制 指令 共有 11 条 。jsr 和 和 ret 指令 在 Java 6 之 前 
用 于 实现 finally 子 句 ， 从 Java 6 开始 ，Oracle 的 
Java 编 详 严 已 经 不 再 使 用 这 两 条 指令 了 ， 本 书 不 
讨论 这 两 条 指令 。return 系 列 指令 有 6 条 ， 用 于 从 
方法 调用 中 返回 ， 将 在 第 7 章 讨 论 方法 调用 和 返回 
时 实现 这 6 条 指令 。 本 和 实现 剩 下 的 3 条 指令 : 


goto、 tableswitch 和 1lookupswitch 。 


5.10.1 ” ”goto 指令 


在 ch05\instructionsNcontrol 目 孙 下 创建 goto.go 
文件 ， 在 其 中 定义 goto 指 令 ， 代 码 如 下 : 


package control 

import "jvmgo/chO5/instructions/base" 
import "jvmgo/cho5/rtda" 

// Branch always 

type GOTO struct{ base.BranchInstruction } 


goto 指 令 进 行 无 条 件 跳 转 ， 其 Execute () 方 
0 不: 


func (self *GOTO) Execute(frame *rtda.Frame) { 
base.Branch(frame, self.OoOffset) 


} 


5.10.2 tableswitch 指 令 


Java 语 言 中 的 switch-case 语 句 有 两 种 实现 方 
式 : 如 果 case 值 可 以 编码 成 一 个 索引 表 ， 则 实现 
成 tableswitch 指 令 ; 人 否则 实现 成 1ookupswitch 指 
令 。Java 虚 拟 机 规范 的 3.10 小 节 里 有 两 个 例子 ， 我 
们 可 以 借用 一 下 。 下 面 这 个 Java 方 法 中 的 switch- 
case 可 以 编译 成 tableswitch 指 令 ， 代 人 码 如 下 : 


int chooseNear(int i) { 
switch (i) { 
case 0: return 
case 1: return 
case 2: return 
default: return - 
} 
} 


POPO 


下 面 这 个 Java 方 法 中 的 switch-case 则 需要 编译 


成 lookupswitch 指 令 : 


Int chooseFar(int 工 ) { 
Switch (i) { 
case -100: return -1; 


case 0: return 0; 
case 100: return 1; 
default: return -1; 


在 ch05Ninstructions\control 目 了 永 下 创建 
tableswitch.go 文 件 ， 在 其 中 定义 tableswitch 指 令 ， 
代码 如 下 : 


package control 

import "jvmgo/chO5/instructions/base" 
import "jvmgo/choO5/rtda" 

// Access jump table by index and jump 
type TABLE SWITCH struct { 


defaultoffset int32 
low int32 
high int32 
jumpoffsets []int32 


} 


tableswitch 指 令 的 操作 数 比 较 复 杂 ， 它 的 


FetchOperands () 方法 如 下 : 


func (self *TABLE_ SWITCH) FetchOperands(reader 
*base.BytecodeReader) { 


reader .SkipPadding() 

self.defaultOoffset = reader.ReadInt32() 

self.low = reader.ReadInt32() 

self.high = reader .ReadInt32() 

jumpOoffsetsCount := self.high - self.low + 1 
self.jumpOoffsets = reader.ReadInt32S(jumpoffsetsCount ) 


tableswitch 指 令 操作 码 的 后 面 有 0~3 字 贡 的 
padding， 以 保证 defaultOffset 在 字 节 码 中 的 地 址 是 
4 的 倍数 。BytecodeReader 结 构 体 的 SkipPadding 
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func (self *BytecodeReader) SkipPadding() { 
for self.pc%4 != © { 
self .ReadUint8() 
} 
} 


defaultOffset 对 应 默认 情况 下 执行 跳 转 所 需 的 
字 节 码 偏 移 量 :low 和 high 记 录 case 的 取 值 范围 ; 
jumpOffsets 是 一 个 索引 表 ， 里 面 存放 high-low+1 
个 int 值 ， 对 应 各 种 case 情 况 下 ， 执 行 跳 转 所 需 的 


字 世 人 码 侦 移 量 。BytecodeReader 绪 构 体 的 


ReadInt32s () 方法 如 下 : 


func (self *BytecodeReader) ReadInt32s(n int32) []int32 { 
ints := make([]int32, n) 
for i := range ints { 
ints[i] = self.ReadInt32() 


return ints 


Execute () 方法 先 从 操作 数 栈 中 弹出 一 个 int 
变量 ， 然 后 看 它 是 否 在 low 和 high 给 定 的 范围 之 
内 。 如 果 在 ， 则 从 jumpOffsets 表 中 查 出 偏 移 量 进 
行 跳 转 ， 否 则 按照 defaultOffset 跳 转 。 代 码 如 下 : 


func (self *TABLE_ SWITCH) Execute(frame *rtda.Frame) { 
index := frame.OperandStack().PopInt() 
var offset int 
if index >= self.low && index <= self.high { 
offset = int(self.jumpoffsets[index-self.1low|) 
} else { 
offset = int(self.defaultOoffset) 


base.Branch(frame, offset) 


5.10.3 ”lookupswitch 指 令 


在 ch05\instructions\control 目 录 下 创建 
lookupswitch.go 文 件 ， 在 其 中 定义 lookupswitch 指 
令 ， 代 码 如 下 : 


package control 

import "jvmgo/chO5/instructions/base" 
import "jvmgo/chO5/rtda" 

type LOOKUP_SWITCH struct { 


defaultoffset int32 
npairs int32 
matchoffsets []int32 


FetchOperands () 方法 也 要 先 跳 过 padding， 
代码 如 下 : 


func (self *LOOKUP_SWITCH) Fetchoperands (reader 
*base.BytecodeReader ) { 

reader .SkipPadding() 

self.defaultOoffset = reader.ReadInt32() 

self .npairs = reader.ReadInt32() 

self.matchoffsets = reader.ReadInt32s(self.npairs * 2) 


: 


matchOffsets 有 点 像 Map， 它 的 key 是 case 值 ， 
value 是 跳 转 偏 移 量 。Execute () 方法 先 从 操作 数 
栈 中 弹出 一 个 int 变 量 ， 然 后 用 它 伍 找 
matchOffsets， 看 是 否 能 找到 匹配 的 key。 如 果 
能 ， 则 按照 value 给 出 的 俩 移 量 跳 拒 ， 人 否则 按照 
defaultOffset 踏 转 。 代 码 如 下 : 


func (self *LOOKUP_SWITCH) Execute(frame *rtda.Frame) { 
key := frame.OperandStack().PopInt() 
for i := int32(0); i < self.npairs*2; i += 2 1{ 
If self.matchoffsets[i] == key { 
offset := self.matchoffsets[i+1] 
base.Branch(frame, int(offset)) 
return 


} 


base.Branch(frame, int(self.defaultOoffset)) 


5.11 扩展 指令 


扩展 指令 共有 6 条 。 和 jsr 指 令 一 样 ， 本 书 不 讨 
论 jsr_w 指 令 。multianewarray 指 令 用 于 创建 多 维 数 
组 ， 在 第 8 章 讨论 数组 时 实现 该 指令 。 本 万 实 现 剩 


下 的 4 条 指令 。 


5.11.1 wide 指令 


加 载 类 指令 、 和 存储 类 指 仿 、ret 指 令 和 iinc 指 令 
需要 按 索引 访问 局 部 变量 表 ， 有 索引 以 uint8 的 形式 
存在 子 广 码 中 。 对 于 大 部 分 方法 来 说 ， 局 部 变量 
表 大 小 部 不 会 超过 256， 所 以 用 一 子 太 来 表示 索引 
束 够 了 了。 但 生 如 和 东 有 方法 的 局 部 变量 表 超 过 这 限 
制 呢 ? Java 庶 拟 机 规范 定义 了 wide 指令 来 扩展 前 


述 指 令 。 


在 ch05\instructions\extended 日 好 下 创建 
wide.go 文 件 ， 在 其 中 定义 wide 措 令 ， 代 码 如 下 : 


package extended 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/instructions/loads" 

import "jvmgo/chO5/instructions/math" 

import "jvmgo/cho5/instructions/stores" 

import "jvmgo/choO5/rtda" 

// Extend local variable index by additional bytes 


type WIDE Struct { 


} 


指令 需 


func (self *WIDE) Fetchoperands(reader *base.BytecodeReader) 


{ 


下 


modifiedInstruction base.Instruction 


wide 指令 改变 其 他 指令 的 行为 ， 
modifiedInstruction 字 段 存放 被 改变 的 指令 。wide 
要 目 己 解码 出 modifiedInstruction ， 
FetchOperands () 方法 的 代码 如 下 : 


opcode := 
switch opcode { 


Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 
Case 


OX15 : 
OX16 : 
OX17 : 
OX18 : 
OX19 : 
OX36 : 
OX37 : 
OX38 : 
OX39 : 
OX3a : 
OX84 : 
OXag9 : 
panic("Unsupported opcode: Oxa9!") 


reader .ReadUint8() 


iload 
Jload 
fload 
dload 
aload 
istore 
lstore 
fstore 
dstore 
astore 
iinc 


FetchOperands () 方法 先 从 字 节 码 中 读 取 一 
字 世 的 操作 码 ， 然 后 创建 子 指令 实例 ， 最 后 谈 取 
于 指令 的 操作 数 。 因 为 没有 实现 ret 指 令 ， 所 以 暂 
时 调用 panic () 函数 终止 程序 执行 。 加 载 指令 和 
存储 指令 部 只 有 一 个 操作 数 ， 需 要 扩展 成 2 字 市 ， 
以 iload 为 例 : 


case Ox15: 
inst := &loads.ILOAD{} 
inst.Index = uint(reader.ReadUint16()) 
self.modifiedInstruction = inst 


iinc 指 令 有 两 个 操作 数 ， 都 需要 扩展 成 2 字 
三 ， 代 码 如 下 : 


case Ox84: 
inst := &math.IINC{} 
inst.Index = uint(reader.ReadUint16()) 
inst.Const = int32(reader.ReadInt16()) 
self.modifiedInstruction = inst 


wide 指令 只 是 增加 了 索引 宽度 ， 并 不 改变 于 
指令 操作 ， 所 以 其 Execute () 方法 只 要 调用 子 指 
令 的 Execute () 方法 即 可 ， 代 码 如 下 : 


func (self *WIDE) Execute(frame *rtda.Frame) { 
self .modifiedInstruction.Execute(frame) 


} 


5.11.2 ifnul 和 iftnonnull 指 令 


在 ch05\instructions\extended 目 录 下 创建 
ifnull.go 文 件 ， 在 其 中 定义 ifnull 和 ifnonnull 指 令 ， 
代码 如 下 : 


package extended 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

type IFNULL struct{ base.BranchInstruction } // Branch if 
reference is null 

type IFNONNULL struct{ base.BranchInstruction } // Branch if 
reference not null 


根据 引用 是 否 是 null 进 行 跳 转 ，ifnull 和 
ifnonnull 指 令 把 栈 顶 的 引用 弹出 。 以 ifnull 指 令 为 
例 ， 它 的 Execute () 方法 如 下 : 


func (self *IFNULL) Execute(frame *rtda.Frame) { 
ref := frame.OperandStack().PopRef() 
if ref == nil { 
base.Branch(frame, self.oOffset) 


5.11.3 ”goto_w 指 令 


在 ch05\instructions\extended 日 好 下 创建 
goto_w.go 文 件 ， 在 其 中 定义 goto_w 指 令 ， 代 码 如 
下 : 


package extended 
import "jvmgo/chO5/instructions/base" 
import "jvmgo/choO5/rtda" 
// Branch always (wide index) 
type GOTO W struct { 
offset int 


} 


goto_w 指 令 和 goto 指 令 的 唯一 区 别 束 是 索引 
从 2 字 节 变 成 了 4 字 节 。FetchOperands () 方法 代 
代 如 下 : 


func (self *GOTO_W) Fetchoperands (reader 
*base.BytecodeReader) { 

self.offset = int(reader.ReadInt32()) 
} 


Execute () 方法 的 代码 如 下 : 


func (self *GOTO_W) Execute(frame *rtda.Frame) { 
base.Branch(frame, self.offset) 


} 


5.12 ”解释 北 


和 令 集 已 经 实现 得 苇 不 多 了 ， 本 态 编 写 一 个 
何 单 的 解释 侣 。 这 个 解释 如 目 前 只 能 执行 一 个 
Java 方 法 ， 但 是 在 后 面 的 革 习 中， 会 不 断 完 善 
它 ， 让 它 变 得 越 来 越 强 大 。 在 ch05 目 录 下 创建 
interpreter.go 文 件 ， 在 其 中 定义 interpret () 画 
数 ， 代 码 如 下 : 


package main 

import "fmt" 

import "jvmgo/cho5/classfile" 

import "jvmgo/chO5/instructions" 

import "jvmgo/chO5/instructions/base" 

import "jvmgo/chO5/rtda" 

func interpret(methodIinfo *classfile.MemberInfo) {...} 


interpret () 方法 的 参数 是 MemberInfo 指 针 ， 
调用 MemberInfo 结 构 体 的 CodeAttribute () 方法 


可 以 获取 它 的 Code 属 性 ， 语 法 结构 如 下 : 


func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodInfo.CodeAttribute( ) 
，V// 其 他 代码 


CodeAttribute () 方法 是 新 增加 的 ， 代 码 在 
ch05\classfilemember_info.go 文 件 中 ， 代 码 如 下 : 


func (self *MemberInfo) CodeAttribute() *CodeAttribute { 
for _, attrIinfo := range self.attributes { 
Switch attrInfo,(type) { 
case *CodeAttribute: 
return attrIinfo.(*CodeAttribute) 


return nil 


. 


得 天 Code 属 性 之 后 ， 可 以 进一步 获得 执行 
法 所 需 的 局 部 变量 表 和 操作 数 栈 空间 ， 以 及 方法 
的 子 信 人 码 。 


func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodInfo.CcodeAttribute( ) 
maxLocals := codeAttr ,MaxLocals( ) 
maxStack := codeAttr .MaxStack( ) 
bytecode := codeAttr.Code() 
,,，// 其 他 代码 


interpret () 方法 的 其 余 代码 先 创建 一 个 
Thread 实 例 ， 然 后 创建 一 个 帧 并 把 它 推 和 Java 席 
拟 机 栈 顶 ， 最 后 执行 方法 。 完 整 的 代码 如 下 : 


func interpret(methodInfo *classfile.MemberInfo) { 
codeAttr := methodInfo.CcodeAttribute( ) 
maxLocals := codeAttr ,MaxLocals( ) 
maxStack := codeAttr .MaxStack( ) 
bytecode := codeAttr,.Ccode() 
thread := rtda,NewThread ( ) 
frame := thread.NewFrame(maxLocals, maxStack) 
thread.PushFrame(frame) 
defer catchErr(frame ) 
loop(thread, bytecode) 


Thread 结 构 体 的 NewFrame () 方法 是 新 增加 
的 ， 代 码 在 ch05\rtda\thread.go 文 件 中 ， 如 下 所 


func (self *Thread) NewFrame(maxLocals, maxStack uint) 
*Frame { 
return newFrame(self, maxLocals, maxStack) 


} 


Frame 结 构 体 也 有 变化 ， 增 加 了 两 个 字段 ， 改 
动 如 下 (在 ch05\rtda\frame.go 文 件 中 ) : 


type Frame struct { 


J]Jower *Frame 
lJocalVars LocalVars 
operandStack *OperandStack 
thread *Thread 
nextPpCc int 


这 两 个 字段 主要 是 为 了 实现 跳 转 指令 而 添加 
有 的， 回顾 一 下 Branch () 方法 ， 代 码 如 下 : 


func Branch(frame *rtda.Frame, offset int) { 
pc := frame.Thread().PC() 
nextPC := pc + offset 
frame.SetNextPC(nextPC) 


Frame 结 构 体 的 newFrame () 方法 也 相应 发 
生 了 变化 ， 改 动 如 下 : 


func newFrame(thread *Thread, maxLocals, maxStack uint) 


*Frame { 
return &Framet 
thread: thread, 
localVars: newLocalVars(maxLocals), 


operandStack: newOperandstack(maxStack), 


回 到 interpret () 方法 ， 我 们 的 解释 硕 目 前 还 
没有 办 法 优雅 地 结束 运行 。 因 为 每 个 方法 的 最 后 
一 条 指令 都 是 某 个 retum 指 令 ， 而 还 没有 实现 
return 指 令 ， 所 以 方法 在 执行 过 程 中 必定 会 出 现 错 
误 ， 此 时 解释 器 逻辑 会 转 到 catchErr () 函数 ， 代 
码 如 下 : 


func catchErr(frame *rtda.Frame) { 
if r := recover(); r != nil { 
fmt.Printf("LocalVars:%v\n", frame.LocalVars()) 
fmt.Printf("OperandStack:%v\n", frame.Operandstack()) 
panic(r) 


辆 效 ， 


执 和 


把 局 部 变量 表 和 操作 效 栈 的 内 容 打 印 出 来 ， 
以 此 来 观察 方法 的 执行 结果 。 还 剩 一 个 loop ( 


func loop(thread 


其 代码 如 下 : 


*rtda.Thread, bytecode [lbyte) { 


frame := thread.PopFrame() 
reader := &base.BytecodeReaderf{} 
for { 


pc := frame.NextPC() 
thread.SetpcC(pc) 


// decode 


reader .Reset(bytecode, pc) 

opcode := reader.ReadUint8() 

:= instructions.NewInstruction(opcode) 
inst.Fetchoperands(reader ) 
frame.SetNextPC(reader.PC()) 


inst 


// execute 


fmt.Printf("pc:%2d inst:%T %v\n", pc, inst, inst) 
inst.Execute(frame) 


loop 


了 指令 


() E 


1 


函数 循环 执行 “计算 pc、 解 码 指令 
三 个 步骤 ， 直 到 遇 到 错误 ! 代码 中 有 


一 个 函数 还 没有 给 出 代码 : NewInstruction () 。 


文 个 函数 是 switch-case 语 句 ， 根 据 操 作 码 创建 具 
体 的 指令 ， 代 码 在 ch05\instructions\factory.go 文 件 
中 ， 如 下 所 示 : 


package instructions 
import "fmt" 
import "jvmgo/chO5/instructions/base" 


import . "jvmgo/cho5/instructions/comparisons" 
import . "jvmgo/cho5/instructions/constants" 
import . "jvmgo/cho5/instructions/control" 
import . "jvmgo/cho5/instructions/conversions" 
import . "jvmgo/cho5/instructions/extended" 
import . "jvmgo/cho5/instructions/loads" 
import . "jvmgo/cho5/instructions/math" 

import . "jvmgo/cho5/instructions/stack" 
import "jvmgo/chOo5/instructions/stores" 


func NewInstruction(opcode byte) base.Instruction { 
switch opcode { 
case Ox00:; return &NOP{} 
Case Ox01: return &ACONST_NULL{} 
default: 
panic(fmt.Errorf("Unsupported opcode: Ox%x!", opcode)) 


这 个 switch-case 语 句 非常 长 ， 为 了 看 约 篇 
幅 ， 这 里 区 不 给 出 全 部 代码 了 。 另 外 ， 有 很 大 一 
部 分 指令 是 没有 操作 数 的 ， 没 有 必要 每 次 都 创建 


| 一 | 


不 同 的 实例 。 为 了 优化 ， 可 以 给 这 些 指 令 定义 单 
例 变量 ， 代 码 如 下 : 


var ( 
nop 
aconst_null 


&NOP{} 
&ACONST_NULL{} 


对 于 这 类 指令 ， 在 NewInstruction () 函数 中 
直接 返回 单 例 变量 即 可 ， 代 码 如 下 : 


func NewInstruction(opcode byte) base.Instruction { 
switch opcode { 
case Ox00: return nop 
case Ox01: return aconst_null 


Ne 
} 


5.13 ”测试 本 章 代 码 


人 德国 大 数学 家 高 斯 有 一 个 广 为 流 传 的 小 故 
事 。 话 说 高 斯 7 多 开始 上 学 ，10 岁 开始 学 习 数 学 。 
有 一 天 ， 数 学 老师 布置 了 一 道 题 : 问 1+2+3..….. 这 
样 从 1 一 二 加 到 100 等 于 多 少 。 老 师 原 以 为 孩子 们 ] 
要 算 上 一 段 时 间 ， 可 是 没 想到 小 高 斯 很 快 台 给 出 
了 答案 。 高 斯 当然 不 是 从 1 一 直 加 到 100， 而 是 用 
更 聪明 的 办 法 计算 的 : 1+100=101，2+99=101...…. 
1 加 到 100 有 50 组 这 样 的 数 ， 所 以 50*101=5050 。 


本 节 用 最 笨 的 办 法 来 计算 这 个 题目 ， 考 验 一 
下 虚拟 机 是 否 可 以 工作 。 随 书 Java 代 码 里 有 一 个 例 
子 ， 代 码 如 下 : 


package jvmgo.book.cho5 ， 
public class GaussTest { 


public static void main(String[] args) { 
int Sum = 0; 
for (int i = 1; i <= 100; I++) { 
Sum += 工 ; 
} 


System,out,printJn(sum) ，; 


下 而 改造 ch05\main.go 文 件 。 首 先 修改 import 
语句 ， 代 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/cho5/classfile" 
import "jvmgo/cho5/classpath" 


main () 函数 不 变 ， 修 改 startUJVM () 函数 ， 
改动 如 下 : 


func startJVM(cmd *Cmd) { 
cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
className := strings.Replace(cmd.class, ".", "/", -1) 
cf := loadCclass(className, cp) 
mainMethod := getMainMethod(cf) 
if mainMethod != nil { 
interpret (mainMethod) 
} else { 
fmt.Printf("Main method not found in class %s\n", 
cmd.class) 


startJVM () 首先 调用 loadClass () 方法 读 取 
并 解析 class 文 件 ， 然 后 调用 getMainMethod () 画 
数 查 找 类 的 main () 方法 ， 最 后 调用 interpret () 
函数 解释 执行 main () 方法 。loadClass () 函数 
的 代码 如 下 : 


func loadClass(className string, cp *classpath.classpath) 
*classfile.ClassFile { 


classData, _, err := cp.ReadcClass(className) 
if err != nil { 
panic(err) 
cf, err := classfile.Parse(classData) 
if err != nil { 


panic(err) 


return cf 


getMainMethod () 玉 数 的 代码 如 下 : 


func getMainMethod(cf *classfile.ClassFile) 
*classfile.MemberInfo { 
for _, m := range cf.Methods() { 


If m.Name() == "main" && m.Descriptor() == " 


([Ljava/lang/String;)V" { 
return m 
} 


return nil 


打开 命令 行 窗口 ， 执 行 下 面 的 命令 编 译本 划 
代码 。 


go install jvmgoxcho05 


编译 成 功 后 ， 在 D: \govworkspace\bin 目 孙 下 
会 出 现 ch05.exe 文 件 。 用 javac 编 译 GaussTest 类 ， 然 
后 用 ch05.exe 执 行 GaussTest 程 序 ， 结 果 如 图 5-3 所 
示 。 注 意 一 定 要 保证 可 以 在 当前 目 孙 下 找到 
GaussTest.class 文 件 ， 否 则 应 该 用 -cp 选项 指定 用 户 
类 路 径 。 


D:\go\workspace\bin>ch05., exe -Xijre ‘C:\Program Files\Java\irel. 8.0 .66”jvmgo, boolG 
k. ch05. GaussTest 
pc: 0 inst:*constants. ICONST 0 &{{] 
: 1 inst:*stores.ISTORE 1 &{0} 
2 inst:*constants. ICONST 1 &{0) 
c: 3 inst:*stores, ISTORE 2 &{0} 


Pe 

pc 

Pp 

pc: 4 inst:*loads, ILOAD 2 &{0} 

pc: 5 inst:*constants. BIPUSH &{100} 
pc 


7 inst:*conmparisons. IF_ICMHPGT &{{13}} 
pc 0 海 ILOAD 1 &{0} 


图 5-3 ”GaussTest 程 序 执行 结果 (1) 


方法 执行 ， 并 打印 出 了 执行 过 的 指令 。 在 我 
们 预料 之 中 ， 方 法 执行 的 最 后 出 现 了 错误 ， 局 部 
变量 表 和 操作 数 栈 的 状态 也 打印 了 出 来 ， 如 图 5-4 
所 示 。 仔 细 观 察 局 部 变量 表 可 以 看 到 5050 这 个 数 

这 正 是 我 们 的 计算 结果 


本 命令 提 才 符 一 口 XxX 
pce: 5 inst:*constants. BIPUSH &{100} 
pc: 7 inst:*comparisons. IF_ ICNMPGT &{{13}} 
LocalVYars:[ {0 <nil> {5050 <nil>} {101 <ni1>}] 
DperandStack:&{0 [ {i101 <nil>} {100 <nil>}]} 
panic: Unsupported opcode: 0xb2! [recovered] 
panic: Unsupported opcode: OQxb2! 


goroutine 1 [running]: 
main. catchErr (Oxc082abd180) 
D:/go/workspace/src/ jvmgo/ ch0D/interpreter. go0:27 +0x22e 


图 5-4 ”GaussTest 程 序 执行 结果 (2) 


5.14 ” 本章 小 结 


虽然 还 有 很 多 跌 陶 ， 但 是 我 们 的 Java 虚 拟 机 
已经 可 以 解释 执行 字 广 翁 了 ， 这 是 一 个 很 大 的 进 
步 ! 下 一 草 将 讨论 类 和 对 象 在 内 存 中 的 布局 ， 并 
且 开 始 实现 引用 类 指令 。 还 等 什么 ? 快 来 阅读 
吧 ! 


第 6 曹 ” 类 和 对 象 


在 第 4 章 ， 我 们 初步 实现 了 线程 私有 的 运行 时 
效 据 区 ， 在 此 基础 上 ， 第 5 草 实现 了 一 个 简单 的 解 
释 硕 和 150 多 条 指令 。 这 崇 指 令 主要 走 操 作 局 部 变 
量 表 和 操作 数 栈 、 进 行 数学 运算 、 比 较 运算 和 跳 
转 控 制 等 。 本 章 将 实现 线程 共享 的 运行 时 数据 
区 ， 包 括 方 法 区 和 运行 时 稼 量 ; 


第 2 章 实 现 了 类 路 径 ， 可 以 找到 class 文 件 ， 并 
把 数据 加 载 到 内 存 中 。 第 3 章 实 现 了 class 文 件 解 
析 ， 可 以 把 class 数 据 解 析 成 一 个 ClassFile 结 构 
体 。 本 章 将 进一步 处 理 ClassFile 结 构 体 ， 把 它 加 
以 转换 ， 放 进 方法 区 以 供 后 续 使 用 。 本 章 还 会 初 


步 讨论 类 和 对 象 的 设计 ， 实 现 一 个 位 单 的 类 加 载 
鲁 ， 并 且 实 现 类 和 对 象 相关 的 部 分 指令 。 


在 开 始 学 习 本 革 之 前 ， 还 十 先 把 目录 结构 准 
备 好 。 复 制 cn05 目 录 ， 改 名 为 ch06。 修 改 main.go 
等 文件 ， 把 import 语 句 中 的 ch05 全 都 改 成 ch06， 然 
后 在 ch06\rtda 目 孙 中 创建 heap 子 目 永 。 现 在 目 孙 
结构 看 起 来 应 该 是 下 面 这 样 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 ~ ch05 
|-cho6 
-classfile 


-classpath 
-instructions 
-rtda 

|-heap 
-cmd.go 
-interpreter.go 
-main.go 


在 第 4 章 中 ， 在 rtda\object.go 文 件 中 定义 了 临 
时 的 Object 结构 体 。 现 在 可 以 把 object.go 移 到 heap 


目 示 下 了 “。 注 意 要 修改 包 名 ， 代 人 码 如 下 : 


package heap 
type Object struct { 

// todo 

} 

还 需要 修改 slot.go、local_vars.go 和 
operand_stack.go 这 三 个 文件 ， 在 其 中 添加 heap 包 
的 import 语 句 ， 并 把 *Object 改 成 *heap.Object。 以 
上 改动 不 大 ， 为 了 下 约 篇 巾 ， 这 里 了 吏 不 给 出 具体 


代码 了 。 


6.1 方法 区 


第 4 章 人 简 蛙 讨论 过 方法 区 ， 它 是 运行 时 数据 区 
的 一 块 逻 辑 区 域 ， 由 多 个 线程 共 诗 。 方 法 区 主要 
存放 从 class 文 件 获取 的 类 信息 。 此 外 ， 类 变量 也 
存放 在 方法 区 中 。 当 Java 虚 拟 机 第 一 次 使 用 某 个 
关 时 ， 它 会 搜索 类 路 算 ， 找 到 相应 的 class 文 件 ， 
做 后 谈 取 并 解析 class 文 件 ， 把 相关 信息 放 进 方法 
区 。 至 于 方法 区 到 质 位 于 何 处 ， 有 是 固定 大 小 还 厦 
动态 调整 ， 和 是否 参与 垃圾 回收 ， 以 及 如 何在 方法 
区 内 存放 类 数据 等 ，Java 虚 拟 机 规范 并 没有 明确 


规定 。 


先 米 看 看 有 哪些 信息 需要 放 进 方法 区 。 


6.1.1 类 信息 


使 用 结构 体 来 表示 将 要 放 进 方法 区 内 的 类 。 
在 ch06\rtda\heap 目 杂 下 创建 class.go 文 件 ， 在 其 中 
定义 Class 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type Class struct { 


accessFlags uint16 

name string // thisClassName 
superClassName string 
interfaceNames []string 
constantPool *ConstantPool 
fields []*Field 
methods []*Method 
loader *ClassLoader 
superClass *Class 
interfaces []*Class 
instanceSlotCount uint 
staticSlotCount uint 
staticVars *Slots 


accessFlags 是 类 的 访问 标志 ， 忆 共 16 比 特 。 
字段 和 方法 也 有 访问 标志 ， 但 具体 标志 位 的 含义 


可 能 有 所 不 同 。 根 据 Java 虚 拟 机 规范 ， 把 各 个 比 
特 位 的 侣 义 统一 定义 在 heap\access_flags.go 文 件 
中 ， 代 码 如 下 : 


package heap 


Ox1000 // class field method 
Ox2000 // class 
Ox4000 // class field 


ACC_SYNTHETIC 
ACC_ANNOTATION 
ACC_ENUM 


const ( 

ACC_PUBLIC = OxO001 // class field method 
ACC_PRIVATE = 0X0002 // field method 
ACC_PROTECTED = 0X0004 // field method 
ACC_STATIC = Ox0008 // field method 
ACC_FINAL = 0Xx0010 // class field method 
ACC_SUPER = 0X0020 // class 
ACC_SYNCHRONIZED = 0X0020 // method 
ACC_VOLATILE = 0X0040 // field 
ACC_BRIDGE = 0X0040 // method 
ACC_TRANSIENT = 0X0080 // field 
ACC_VARARGS = 0X0080 // method 
ACC_NATIVE = 0X0100 // method 
ACC_INTERFACE = 0X0200 // class 

ACC_ABSTRACT = 0X0400 // class method 
ACC_STRICT = Ox0800 // method 


回 到 Class 结 构 体 。name 、superClassName 和 和 
interfaceNames 字 段 分 别 存放 类 名 、 超 类 名 和 接口 


名 。 注 意 这 些 类 名 都 是 完全 限定 名 ， 具 有 


java/lang/Object 的 形式 。constantPool 字 段 存 放 运 
行 时 负重 池 指 针 ，fields 和 methods 字 段 分 别 存放 
字段 表 和 方法 表 。 运 行 时 常量 池 将 在 6.2 太 中 评 细 


J 


继续 编辑 class.go 文 件 ， 在 其 中 定义 newClass 
() 函数 ， 用 来 把 ClassFile 结 构 体 转换 成 Class 结 
构 体 ， 代 码 如 下 : 


func newClass(cf *classfile.ClassFile) *Class { 
class := &Classt{} 
class.accessFlags = cf.AccessFlags() 
class.name = cf.ClassName() 
class.superClassName = cf.SuperClassName() 
class.interfaceNames = cf,InterfaceNames( ) 
class.constantPool = newConstantPool(class, 

cf.ConstantPool()) // 见 


6 .2 小 市 


class.fields = newFields(class, cf.Fields()) // 见 


6.1.2 小 市 


class.methods = newMethods(class, cf.Methods()) // 见 


6.1.3 小 市 


return class 


} 


newClass () 函数 又 调用 了 newConstantPool 
() 、newFields () 和 newMethods () ， 这 三 个 
函数 的 代码 将 在 后 面 的 小 节 给 出 。 继 续 编 辑 
class.go 文 件 ， 在 其 中 定义 8 个 方法 ， 用 来 判断 某 
个 访问 标志 是 否 被 设置 。 这 8 个 方法 都 很 简单 ， 为 
了 节约 篇 幅 ， 这 里 只 给 出 IsPublic () 方法 的 代 
码 。 


func (self *Class) IsPublic() bool { 
return © != self.accessFlags&ACC_ PUBLIC 
} 


后 面 将 要 介绍 的 Field 和 Method 结 构 体 也 有 类 
似 的 方法 ， 届 时 也 将 不 再 资 述 ， 请 读者 注意 。 


6.1.2 ”字段 信息 


字段 和 方法 都 属于 类 的 成 员 ， 它 们 有 一 些 相 
同 的 信息 〈 访 问 标志 、 名 字 、 描 述 符 ) 。 为 了 避 
免 重复 代码 ， 创 建 一 个 结构 体 存 放 这 些 信 息 。 在 
ch06\rtda\heap 目 隶 下 创建 class_member.go 文 件 ， 
在 其 中 定义 ClassMember 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type ClassMember struct { 


accessFlags uint16 
name String 
descriptor String 
class *Class 


func (self *ClassMember) copyMemberInfo(memberInfo 
*classfile.MemberInfo) {...} 


前 面 三 个 字段 的 含义 很 明显 ， 这 里 不 多 解 
释 。class 字 段 存 放 Class 结 构 体 指针 ， 这 样 可 以 通 


过 字段 或 方法 访问 到 它 所 属 的 类 。 
copyMemberInfo () 方法 从 class 文 件 中 复制 数 
据 ， 代 码 如 下 : 


func (self *ClassMember) copyMemberInfo(memberInfo 
*classfile.MemberInfo) { 
self.accessFlags = memberIinfo.AccessFlags() 
self.name = memberInfo.Name() 
self.descriptor = memberInfo.Descriptor() 


ClassMember 定 义 好 了 ， 接 下 来 在 
ch06\rtda\heap 目 杂 下 创建 field.go 文 件 ， 在 其 中 完 
义 Field 结 构 体 ， 代 码 如 下 : 


package heap 

import "jvmgo/cho6/classfile" 

type Field struct { 
ClassMember 


func newFields(class *Class, cfFields 
[]j*classfile.MemberInfo) []*Field {...} 


Field 结 构 体 比较 简单 ， 目 前 所 有 信息 都 是 从 
ClassMember 中 继承 过 来 的 。newFields () 函数 
根据 class 文 件 的 字段 信息 创建 字段 表 ， 代 码 如 
下 : 


func newFields(class *Class, cfFields 
[]j*classfile.MemberInfo) []*Field { 
fields := make([]*Field, len(cfFields)) 
for i, cfField := range cfFields { 
fields[i] = &Field{} 
fields[i].class = class 
fields[i].copyMemberInfo(cfField) 
} 
return fields 


} 


6.1.3 “方法 信息 


方法 比 字 段 和 微 复杂 一 些 ， 因 为 方法 中 有 了 字 
太 代 。 在 ch06\rtda\heap 目 杂 下 创建 method.go 文 
件 ， 在 其 中 定义 Method 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type Method struct { 


ClassMember 

maxStack uint 
maxLocals uint 
code [lbyte 


} 
func newMethods(class *Class, cfMethods 
[]*classfile.MemberInfo) [1]*Method {...} 


maxStack 和 maxLocals 字 段 分 别 存放 操作 数 栈 
和 局 部 变量 表 大 小 ， 这 两 个 值 是 由 Java 编 译 器 计算 
好 的 。code 字 段 存放 方法 字 广 码 。newMethods 
() 画 数 根据 class 文 件 中 的 方法 信息 创建 Method 
表 ， 代 码 如 下 : 


func newMethods(class *Class, cfMethods 
[]*classfile.MemberInfo) []*Method { 
methods := make([]*Method, len(cfMethods)) 
for i, cfMethod := range cfMethods { 
methods[i] = &Method{} 
methods[i].class = class 
methods[i].copyMemberIinfo(cfMethod) 
methods[i].copyAttributes(cfMethod) 
} 


return methods 


大 家 还 记得 吗 ? maxStack、maxLocals 和 和 字 广 
人 码 在 class 文 件 中 十 以 属性 的 形式 存 鱼 在 
method_info 结 构 中 的 。 如 采 读 者 已 经 乐 记 的 话 ， 
可 以 参考 3.4.5 小 六。copyAttributes () 方法 从 
method_info 结 构 中 提取 这 些 信息 ， 代 人 码 如 下 : 
func (self *Method) copyAttributes(cfMethod 
*classfile.MemberInfo) { 
If codeAttr := cfMethod.CodeAttribute(); codeAttr != nil { 
self.maxStack = codeAttr.MaxStack() 


self.maxLocals = codeAttr .MaxLocals() 
self.code = codeAttr.Code() 


到 此 为 止 ， 除 了 ConstantPool 还 没有 介绍 以 
外 ， 已 经 定义 了 4 个 结构 体 ， 这 些 结 构 体 之 间 的 关 
系 如 图 6-1 所 示 。 


ConstantPool - 14 Class ClassMember 


ee 


Method 


图 6-1 ”Class 结 构 体 关系 


6.1.4 其 他 信息 


Class 结 构 体 还 有 几 个 字段 没有 说 明 。loader 
字段 存放 类 加 载 硕 指针 ，superClass 和 interfaces 字 
段 存 放 类 的 超 类 和 接口 指针 ， 这 三 个 字段 将 在 6.3 
万 介绍 。staticSlotCount 和 instanceSlotCount 字 段 分 
别 存 放 类 变量 和 实例 变量 占据 的 空间 大 小 ， 
staticVars 字 段 人 存放 静态 变量 ， 这 三 个 字段 将 在 6.4 


人 


6.2 ”运行 时 常量 祁 


运行 时 第 量 池 主 要 存放 两 类 信息 : 字面 量 
(literal) 和 符号 引用 (symbolic reference) 。 字 
面 量 包括 整数 、 浮 点 数 和 字符 串 字 面 量 ， 从 号 引 
用 包括 类 符号 引用 、 字 段 符号 引用 、 方 法 符号 引 
用 和 接口 方法 符号 引用 。 在 ch06\rtda\heap 目 好 下 
创建 constant_pool.go 文 件 ， 在 其 中 定义 Constant 接 
口 和 ConstantPool 结 构 体 ， 代 码 如 下 : 


package heap 
import "fmt" 
import "jvmgo/cho6/classfile" 
type Constant interface{} 
type ConstantPool struct { 
Class *Class 
consts [1]Constant 


func newConstantPool(class *Class, cfCp 
classfile.ConstantPool) *ConstantPool {...} 
func (self *ConstantPool) GetConstant(index uint) Constant 


Te 


GetConstant () 方法 根据 索引 返回 常量 ， 代 
码 如 下 : 


func (self *ConstantPool) GetConstant(index uint) Constant { 
if c := self.consts[index]; c != nil { 
return c 


panic(fmt.Sprintf("No constants at index %d", index)) 


newConstantPool () 画 数 把 class 文 件 中 的 各 
量 池 转换 成 运行 时 第 量 池 。 这 个 函数 稍微 有 点 复 
洒 ， 主 体 代 人 码 如 下 : 


func newConstantPool(class *Class, cfCp 
classfile.ConstantPool) *ConstantPool { 
cpCount := len(cfCcp) 


consts := make([]Constant, cpCount) 
rtcp := &ConstantPool{class, consts} 
for i := 1; i < cpCount; i++ { 


cpInfo := cfCp[i] 
Switch cpInfo.(type) { 


} 


return rtcp 


其 实 也 不 难 理解 ， 核 心 届 辑 束 是 把 
[jclassfile.ConstantInfo 转 换 成 []heap.Constant°。 具 
体 常量 的 转换 在 switch-case 中 ， 我 们 分 几 次 来 
看 o 


最 简单 的 是 int 或 float 型 芝 量 ， 直 接 取 出 浓 量 
值 ， 放 进 consts 中 即 可 。 


Switch cpInfo.(type) { 

case *classfile.ConstantIintegerIinfo: 
intInfo := cpInfo.(*classfile.ConstantIintegerInfo) 
consts[i] = intInfo.Value() // int32 

case *classfile.ConstantFloatInfo: 
floatIinfo := cpInfo.(*classfile.ConstantFloatIinfo) 
consts[i] = floatInfo.Value() // float32 


如 琳 是 long 或 double 型 常量 ， 也 是 直接 提取 季 
量 值 放 进 consts 中 。 但 是 要 注 章 ， 这 两 种 类 型 的 向 
量 在 常量 池 中 都 是 占据 两 个 位 置 ， 所 以 索引 要 特 
殊 处 理 ， 代 码 如 下 : 


case *classfile.ConstantLongInfo: 


longInfo := cpInfo.(*classfile.ConstantLongInfo) 
consts[i] = longInfo.Value() // int64 
工 十 十 


case *classfile.ConstantDoubleInfo: 
doubleInfo := cpInfo.(*classfile.ConstantDoubleInfo) 


consts[i] = doubleInfo.Value() // float64 
工 十 十 


如 朱 和 字 符 串 音量 ， 直 搂 取出 Go 语言 字符 


果 ， 放 进 consts 中 ， 人 代码 如 下 : 


case *classfile.ConstantStringInfo: 
stringInfo := cpInfo.(*classfile.ConstantStringInfo) 


consts[i] = stringInfo.String() // string 


还 镜 下 4 种 类 型 的 常量 需要 处 理 ， 分 别 十 类 、 
字段 、 方 法 和 接口 方法 的 符号 引用 。 后 面 的 草 市 
会 详细 介绍 这 4 种 符号 引用 ， 下 面 生 剩 下 的 代码 。 


case *classfile.ConstantClassInfo: 
classInfo := cpInfo.(*classfile.ConstantClassInfo) 


consts[i] = newClassRef(rtCcp, classInfo) // 见 
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case *classfile.ConstantFieldrefInfo: 
fieldrefIinfo := cpInfo.(*classfile.ConstantFieldrefInfo) 


consts[i] = newFieldRef(rtcp, fieldrefInfo) // 见 
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case *classfile.ConstantMethodrefInfo: 

methodrefInfo := cpInfo. 
(*classfile.ConstantMethodrefInfo) 

consts[i] = newMethodRef(rtcp, methodrefIinfo) // 帆 


6.2.3 小 节 
case *classfile.ConstantIinterfaceMethodrefIinfo: 
methodrefInfo := cpInfo. 
(*classfile.ConstantIinterfaceMethodrefInfo) 
consts[i] = newInterfaceMethodRef(rtCp, methodrefIinfo) // 
见 


6.2.4 小 市 


基本 类 型 钊 量 的 使 用 请 参考 6.40 。 


6.2.1 类 人 和 从 号 引用 


因为 4 种 类 型 的 符号 引用 有 一 些 共性 ， 所 以 仍 
然 使 用 继承 来 减少 重复 代码 。 在 ch06\rtda\heap 目 
录 下 创建 cp_symref.go 文 件 ， 在 其 中 定义 SymRef 
结构 体 ， 代 码 如 下 : 


package heap 
// symbolic reference 
type SymRef struct { 


cp *ConstantPool 
className string 
class *Class 


} 


cp 字段 存放 符号 引用 所 在 的 运行 时 第 量 池 指 
针 ， 这 样 珑 可 以 通过 符号 引用 访问 到 运行 时 各 量 
池 ， 进 一 步 久 可 以 访问 到 类 数据 。className 字 上 段 
存放 类 的 完全 限定 名 。class 字 段 缓存 解析 后 的 类 


结构 体 指 针 ， 这 样 关 符号 引用 只 需要 解析 一 次 束 
可 以 了 ， 后 续 可 以 直接 使 用 绥 存 值 。 对 于 类 符号 
引用 ， 只 要 有 类 名 ， 束 可 以 解析 符号 引用 。 对 于 
字段 ， 下 先 要 解析 类 符号 引用 得 到 类 数据 ， 然 后 
用 字段 名 和 描述 符 得 找 字 段 数 据 。 方 法 符号 引用 
的 解析 过 程 和 字段 符号 引用 类 似 。 


SymRef 定 义 好 了 ， 接 下 来 在 ch06\rtda\heap 目 
杂 下 创建 cp_classref.go 文 件 ， 在 其 中 定义 ClassRef 
结构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type ClassRef struct { 

SymRef 


func newClassRef(cp *ConstantPool, 
classInfo *classfile.ConstantClassIinfo) *ClassRef 


ee 


ClassRef 继 承 了 SymRef， 但 是 并 没有 添加 任 
何 字 段 。newClassRef () 函数 根据 class 文 件 中 存 
储 的 类 稼 量 创 建 ClassRef 实 例 ， 代 码 如 下 : 


func newClassRef(cp *ConstantPool, 
classInfo *classfile.ConstantClassInfo) *ClassRef { 
ref := &ClassRef{} 
ref.cp = cp 
ref.className = classInfo.Namel() 
return ref 


类 符号 引用 的 解析 将 在 6.5.2 太 讨论 。 


6.2.2 ”字段 符号 引用 


在 6.1.2 节 中 ， 定 义 了 ClassMember 结 构 体 来 存 
放 字 段 和 方法 共有 的 信息 。 类 似 地 ， 本 和 定义 
MemberRef 结 构 体 来 存放 字段 和 方法 符号 引用 共 
有 的 信息 。 在 ch06\rtda\heap 目 录 下 创建 
cp_memberref.go 文 件 ， 在 其 中 定义 MemberRef 结 
构 体 ， 代 码 如 下 : 


package heap 

import "jvmgo/cho6/classfile" 

type MemberRef struct { 
SymRef 
name String 
descriptor string 


} 
func (self *MemberRef) copyMemberRefInfo( 
refInfo *classfile.ConstantMemberrefInfo) {...} 


读者 可 能 会 有 疑问 : 在 Java 中 ， 我 们 并 不 能 
在 同一 个 类 中 定义 名 字 相 同 ， 但 类 型 不 同 的 两 个 


字段 ， 那 么 字段 符号 引用 为 什么 还 要 存放 字段 朱 
述 符 昵 ? 管 案 是 ， 这 只 是 Java 语 言 的 限制 ， 而 不 
是 Java 庶 拟 机 规范 的 限制 。 也 丈 是 说 ， 站 在 Java 庶 
拟 机 的 角度 ， 一 个 关 是 完全 可 以 有 多 个 同名 字段 
的 ， 只 要 它们 的 类 型 互 不 相同 吏 可 以 。 
copyMemberRefInfo () 方法 从 class 文 件 内 存储 的 
字段 或 方法 第 量 中 提取 数据 ， 代 码 如 下 : 


func (self *MemberRef) copyMemberRefInfo(refInfo 
*classfile.ConstantMemberrefInfo) { 

self.className = refInfo.ClassName() 

self.name, self.descriptor = refInfo.NameAndDescriptor() 


ly 


MemberRef 定 义 好 了 ， 接 下 来 在 
ch06\rtda\heap 目 隶 下 创建 cp_fieldref.go 文 件 ， 在 
其 中 定义 FieldRef 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type FieldRef struct { 


MemberRef 
field *Field 


func newFieldRef(cp *ConstantPool, 
refInfo *classfile.ConstantFieldrefInfo) *FieldRef 
{in} 


field 字 上 段 线 存 解析 后 的 字段 指针 ， 
newFieldRef () 方法 创建 FieldRef 实 例 ， 代 码 如 
下 : 


func newFieldRef(cp *ConstantPool, 
refInfo *classfile.ConstantFieldrefIinfo) *FieldRef { 
ref := &FieldRef{} 
ref.cp = cp 
ref .copyMemberRefInfo(&refInfo.ConstantMemberrefInfo) 
return ref 


字段 符号 引用 的 解析 将 在 6.5.2 了 讨论 。 


6.2.3 “方法 符号 引用 


在 ch06\rtda\heap 目 录 下 创建 cp_methodref.go 
文件 ， 在 其 中 定义 MethodRef 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type MethodRef struct { 
MemberRef 
method *Method 


func newMethodRef(cp *ConstantPool, 
refInfo *classfile.ConstantMethodrefInfo) *MethodRef { 
ref := &MethodRef{} 
ref.cp = cp 
ref .copyMemberRefIinfo(&refInfo.ConstantMemberrefInfo) 
return ref 


上 上面 的 代码 和 字段 符号 引用 大 同 小 异 ， 
束 不 多 解释 了 。 方 法 符号 引用 的 解析 将 在 第 7 章 讨 
论 方法 调用 时 详细 介绍 。 


6.2.4 接口 方法 符号 引用 


在 ch06tdasheap 目 孙 下 创建 
cp_interface_methodref.go 文件 ， 在 其 中 定义 
Interface-MethodRef 结 构 体 ， 代 码 如 下 : 


package heap 
import "jvmgo/cho6/classfile" 
type InterfaceMethodRef struct { 
MemberRef 
method *Method 


func newInterfaceMethodRef(cp *ConstantPool, 
refInfo *classfile.ConstantIinterfaceMethodrefInfo) 
*InterfaceMethodRef { 
ref := &InterfaceMethodReff{} 
ref.cp = cp 
ref .copyMemberRefInfo(&refIinfo.ConstantMemberrefInfo) 
return ref 


代码 和 剖面 乱 不 多 ， 也 不 多 解释 了。 接口 方 
法 符号 引用 的 解析 同样 会 在 第 7 草 详 细 介绍 。 到 此 


为 止 ， 所 有 的 符号 引用 都 已 经 定义 好 了 ， 它 们 的 
继承 结构 如 图 6-2 所 示 。 


SymRef 
ClassRef MemberRef 
Interface MethodRef MethodRef FieldRef 


图 6-2 ”符号 引用 结构 体 继承 关系 


6.3” 关 加 我 盔 


Java 虚 拟 机 的 类 加 载 系 统 十 分 复杂 ， 本 闻 将 
初步 实现 一 个 简化 版 的 类 加 载 锅 ， 后 面 的 章节 中 
还 会 对 它 进行 扩展 。 在 ch06/rtda/heap 目 孙 下 创建 
class_loader.go 文 件 ， 在 其 中 定义 ClassLoader 结 构 
体 ， 代 码 如 下 : 


package heap 
import "fmt" 
import "jvmgo/cho6/classfile" 
import "jvmgo/cho6/classpath" 
type ClassLoader Struct { 
cp *classpath.Classpath 
classMap map[lstringl]*Class // loaded classes 


func NewClassLoader(cp *classpath.Classpath) *ClassLoader 


{nt 
func (self *ClassLoader) LoadCclass(name string) *Class {...} 


ClassLoader 依 赖 Classpath 来 搜索 和 读 取 class 
文件 ，cp 字 段 保 存 Classpath 指 针 。classMap 字 段 


记录 已 经 加 载 的 类 数据 ，key 是 类 的 完全 限定 名 。 
在 前 面 讨论 中 ， 方 法 区 一 直 只 是 个 抽象 的 概念 ， 
现在 可 以 把 classMap 字 段 当 作 方法 区 的 具体 实 

现 。NewClassLoader () 函数 创建 ClassLoader 实 
例 ， 代 码 比较 简单 ， 如 下 所 示 : 


func NewClassLoader(cp *classpath.Classpath) *ClassLoader { 
return &ClassLoadert{ 
cp: cp, 
classMap: make(map[string]*Class), 


LoadClass () 方法 把 类 数据 加 载 到 方法 区 ， 
代码 如 下 : 


func (self *ClassLoader) LoadCclass(name string) *Class { 
if class, ok := self.classMap[namel]; ok { 
return class // 类 已 经 加 载 


return self.loadNonArrayClass (name) 


} 


先 查 找 classMap， 看 类 是 否 已 经 个 加 载 。 如 
果 是 ， 和 直接 返回 类 数据 ， 奋 则 调用 
loadNonArrayClass () 方法 加 载 类 。 数 组 类 和 普 
通 类 有 很 大 的 不 同 ， 它 的 数据 并 不 是 来 目 class 文 
件 ， 而 是 由 Java 虚 拟 机 在 运行 期 间 生 成 。 本 章 暂 
不 考虑 数组 类 的 加 载 ， 留 到 第 8 草 详细 讨论 。 
loadNonArrayClass () 方法 的 代码 如 下 : 


func (self *ClassLoader) loadNonArrayClass(name string) 


*Class { 
data, entry := self.readClass(name) 
class := self.defineClass(data) 
link(class) 


fmt.Printf("[Loaded %s from %s]\n", name, entry) 
return class 


可 以 看 到 ， 关 的 加 载 大 致 可 以 分 为 三 个 步 
又 : 首先 找到 class 文 件 并 把 数据 起 取 a 到 内 存 ， 然 
后 解析 class 文 件 ， 生 成 虚拟 机 可 以 使 用 的 类 数 


QH 


据 ， 并 放 入 万 法 区 ;最 后 进行 链接 。 下 面 分 别 讨 


论 这 三 个 步 又 。 


6.3.1 readClass () 


readClass () 方法 的 代码 如 下 : 


func (self *ClassLoader) readclass(name string) ([]byte, 
classpath.Entry) { 


data, entry, err := self.cp.ReadClass(name) 
if err != nil { 
panic("java.lang.ClassNotFoundException: " + Name) 


return data, entry 


readClass () 方法 只 是 调用 了 Classpath 的 
ReadClass () 方法 ， 并 进行 了 错误 处 理 。 需 要 解 
释 一 下 它 的 返回 值 。 为 了 打印 类 加 载 信息 ， 把 最 

终 加 载 class 文 件 的 类 路 径 项 也 返回 给 了 调用 者 。 


6.3.2 defineClass () 


defineClass () 方法 的 代码 如 下 : 


func (self *ClassLoader) defineClass(data [lbyte) *Class { 
class := parseClass(data) 
class.loader = self 
resolveSuperClass(class) 
resolveInterfaces(class) 
self.classMap[class.name] = class 
return class 


defineClass () 方法 首先 调用 parseClass () 
函数 把 class 文 件数 据 转换 成 Class 结 构 体 。Class 结 
构 体 的 superClass 和 interfaces 字 段 存 放 超 类 名 和 直 
接 接 口 表 ， 这 些 类 名 其 实 都 是 符号 引用 。 根 据 
Java 虚 拟 机 规范 的 5.3.5 节 ， 调 用 resolveSuperClass 
() 和 resolveInterfaces 〈) 函数 解析 这 些 类 符号 
引用 。 下 面 是 parseClass () 函数 的 代码 。 


func parseClass(data []byte) *Class { 
cf, err := classfile.Parse(data) 
if err != nil { 
panic("java.lang.ClassFormatError") 
return newClass(cf) // 见 
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resolveSuperClass () 函数 的 代码 如 下 : 


func resolveSuperClass(class *Class) { 
if class.name != "java/lang/Object" { 
class.superClass = 
class.1loader .LoadClass(class.superClassName) 
} 
} 


再 复习 一 下 : 除 java.lang.Object 以 外 ， 所 有 的 
拓 都 有 且 仅 有 一 个 超 类 。 因 此 ， 除 非 是 Object 
类 ， 否 则 需要 递归 调用 LoadClass () 方法 加 载 它 
的 超 类 。 与 此 类 似 ，resolveInterfaces 〈) 函数 递 
归 调 用 LoadClass () 方法 加 载 类 的 每 一 个 直接 接 
口 ， 代 码 如 下 : 


func resolveInterfaces(class *Class) { 
interfaceCount := len(class.interfaceNames) 
If interfaceCount > 0 { 
class.interfaces = make([]*Class, interfaceCount) 
for i, interfaceName := range class.interfaceNames { 
class.interfaces[il] = 
class.1loader .LoadClass(interfaceNanme) 


} 


6.3.3 link () 


类 的 链接 分 为 验证 和 准备 两 个 必要 阶段 ，link 
() 方法 的 代码 如 下 : 


func link(class *Class) { 
verify(class) 
prepare(class) 


} 


为 了 确 你 安全 性 ，Java 虚 拟 机 规范 要 求 在 执 
行 类 的 任何 代码 之 前 ， 对 类 进行 闫 格 的 验证 。 由 
于 篇 幅 的 原因 ， 本 书 忽略 验证 过 程 。Java 虚 拟 机 
规范 4.10 世 详细 介绍 了 类 的 验证 算法 ， 感 兴趣 的 
读者 可 以 演 试 目 己 实 现 。verify () 辑 数 空空 如 
也 ， 代 码 如 下 : 


func verify(class *Class) { 
// todo 


. 


准备 阶段 主要 是 给 类 变量 分 配 空间 并 给 予 初 
始 值 ，prepare () 画 数 推迟 到 6.4 节 再 介绍 。 


6.4 对象、 实例 变量 和 类 变量 


在 第 4 章 中 ， 定 义 了 LocalVars 结 构 体 ， 用 来 表 
示 局 部 变量 表 。 从 逻辑 上 来 看 ，LocalVars 实 例 就 
像 一 个 数组 ， 这 个 数组 的 每 一 个 元 素 都 足够 容纳 
一 个 int、float 或 引用 值 。 要 放 入 double 或 者 long 
值 ， 需 要 相 邻 的 两 个 元 素 。 这 个 结构 体 不 是 正好 
也 可 以 用 来 表示 类 变量 和 实例 变量 吗 ? 


没 错 ! 但 是 ， 由 于 rtda 包 已 经 依赖 了 heap 包 ， 
而 Go 语言 的 包 又 不 能 相互 依赖 ， 所 以 heap 包 中 的 
go 文件 是 无 法 导入 rtda 包 的 ， 否 则 Go 编译 避 就 会 
报 蚀 。 为 了 解决 这 个 问题 ， 只 好 容 态 一 些 重 复 代 
码 的 存在 。 在 ch06\rtda\heap 目 录 下 创建 slots.go 文 


件 ， 把 slot.go 和 ]ocal_vars.go 文 件 中 的 内 容 找 贝 进 
来 ， 然 后 在 此 基础 上 修改 ， 代 码 如 下 : 


package heap 
import "math" 
type Slot struct { 
num int32 
ref *Object 


} 
type Slots [1]Slot 


羡 数 和 方法 的 内 容 部 没什么 变化 ， 为 了 节约 
篇 幅 ， 吏 不 给 出 详细 代码 了 ， 下 面 息 列表。 


func newSlots(slotCount uint) Slots {...} 

func (self Slots) SetIint(index uint, val int32) {...} 
func (self Slots) GetIint(index uint) int32 {...} 

func (self Slots) SetFloat(index uint, val float32) {...} 
func (self Slots) GetFloat(index uint) float32 {...} 

func (self Slots) SetLong(index uint, val int64) {...} 
func (self Slots) GetLong(index uint) int64 {...} 

func (self Slots) SetDouble(index uint, val float64) {...} 
func (self Slots) GetDouble(index uint) float64 {...} 
func (self Slots) SetRef(index uint, ref *Object) {...} 
func (self Slots) GetRef(index uint) *Object {...} 


Slots 结 构 体 准备 束 绪 ， 可 以 使 用 了 了。Class 结 
构 体 早 在 6.1 廊 束 定 义 好 了 了 ， 代 码 如 下 : 


type Class struct { 


staticVars *Slots 


打开 ch06\rtda\heap\object.go 文 件 ， 给 Object 
结构 体 添 加 两 个 字段 ， 一 个 存放 对 象 的 Class 指 
针 ， 一 个 存放 实例 变量 ， 代 码 如 下 : 


type Object Struct { 
class *Class 
fields Slots 

} 


授 下 来 的 问题 古 ， 如 何 知 道 脐 人 态 变 量 和 实例 
变量 需要 多 少 空间 ， 以 及 哪个 字段 对 应 Slots 中 的 
哪个 位 置 呢 ? 


第 一 个 问题 比较 好 解决 ， 只 要 数 一 下 类 的 子 
段 邹 可 。 假 设 茶 个 类 有 m 个 静态 字段 和 n 个 实例 字 
段 ， 那 么 静态 变量 和 实例 变量 所 需 的 空间 大 小 束 
分 别 是 m' 和 nm'。 这 里 要 注意 两 点 。 首 完 ， 类 是 可 
以 继承 的 。 也 就 古 说 ， 在 数 实例 变量 时 ， 要 还 归 
地 数 超 类 的 实例 变量 ， 其 次 ，long 和 double 了 字段 者 
占据 两 个 位 置 ， 所 以 m>=m，n>=n。 


第 二 个 问题 也 不 算 难 ， 在 数字 段 时 ， 给 字段 
按 顺 序 编 上 号 就 可 以 了 。 这 里 有 三 点 需要 要 注 
意 。 首 先 ， 静 态 字 上 段 和 实例 字段 要 分 开 编 号 ， 否 
则 会 混乱 。 其 次 ， 对 于 实例 字段 ， 一 定 要 从 继承 
关系 的 最 顶端 ， 也 就 是 java.lang.Object 开 始 编号 ， 
否则 也 会 混乱 。 最 后 ， 编 号 时 也 要 考虑 long 和 
double 类 型 。 


打开 field.go 文 件 ， 给 Field 结 构 体 加 上 slotId 字 
段 ， 代 码 如 下 : 


type Field struct { 
ClassMember 
slotId uint 

} 


打开 class_ loadergo 文 件 ， 在 其 中 定义 prepare 
WU 函数 ， 代 码 如 下 : 


func prepare(class *Class) { 
calcIinstanceFieldSlotIds(class) 
calcStaticFieldSlotIds(class) 
allocAndInitStaticVars(class) 

} 


calcInstanceFieldSlotIds () 函数 计算 实例 字 
段 的 个 数 ， 同 时 给 它们 编号 ， 代 但 如 下 : 


func calcInstanceFieldSlotIds(class *Class) { 
slotId := uint(0) 
if class.superClass != nil { 
slotId = class.superClass.instanceSlotCount 


for _, field := range class.fields { 


if !field.IsStatic() { 
field.slotId = slotId 
slotId++ 
if field.isLongOrDouble() { 

slotId++ 

} 

} 

} 


class.instanceSlotCount = slotId 


} 


calcStaticFieldSlotIds () 函数 计算 静态 字段 
的 个 数 ， 同 时 给 它们 编号 ， 代 码 如 下 : 


func calcStaticFieldSlotIids(class *Class) { 
slotId := uint(0) 
for _, field := range class.fields { 
If field.IsStatic() { 
field.sJotId = slotId 
slotId++ 
if field.isLongOrDouble() { 
slotId++ 
} 
} 


class.staticSlotCount = slotId 


} 


Field 结 构 体 的 isLongOrDouble () 方法 返回 
字段 是 否 是 long 或 double 类 型 ， 代 码 如 下 : 


func (self *Field) isLongOrDouble() bool { 
return self.descriptor == "J" || self.descriptor == "D" 


} 


allocAndInitStaticVars () 函数 给 类 变量 分 配 
空间 ， 然 后 给 它们 赋予 初始 值 ， 代 人 码 如 下 : 


func allocAndInitStaticVars(class *Class) { 
class.staticVars = newSlots(class.staticSlotCount) 
for _, field := range class.fields { 
if field.IsStatic() && field.IsFinal() { 
initStaticFinalVar(class, field) 


为 Go 语言 会 保证 新 创建 的 Slot 结 构 体 有 默 
认 值 num 字 段 是 0，ref 字 段 是 nil) ， 而 浮 点 数 0 
编码 之 后 和 整数 0 相同 ， 所 以 不 用 做 任何 操作 或 可 
以 保证 静态 变量 有 默认 初始 值 (数字 类 型 是 0， 引 
用 类 型 是 null) 。 如 有 果 静 态 变 量 属 于 基本 类 型 或 
String 类 型 ， 有 final 修 饰 符 ， 且 它 的 值 在 编译 期 已 
知 ， 则 该 值 存储 在 class 文 件 常量 池 中 。 


initStaticFinalVar () 函数 从 常量 池 中 加 载 常量 
值 ， 然 后 给 静态 变量 赋值 ， 代 码 如 下 : 


func initStaticFinalVar(class *Class, field *Field) { 
vars := class.staticVars 
cp := class.constantPool 
cpIndex := field.ConstValueIindex() 
SlotId := field.SlotId() 
if cpIndex > 0 { 
Switch field.Descriptor() { 
case Lz "B", TE "S", i 
val := cp.GetConstant(cpIndex).(int32) 
vars.SetInt(slotId, val) 
Case "J": 
val := cp.GetConstant(cpIndex).(int64) 
vars.SetLong(slotId, val) 
case "F": 
val := cp.GetConstant(cpIndex). (float32) 
vars.SetFloat(slotIid, val) 
case "D": 
val := cp.GetConstant(cpIndex). (float64) 
vars.SetDouble(slotId, val) 
case "Ljava/lang/String;": 
panic("todo") // 在 第 


字符 串 常量 将 在 第 8 章 讨论 ， 这 里 先 调用 


panic () 玉 数 终止 程序 执行 。 需 要 给 Field 结 构 体 


添加 constValueIndex 字 上 段 ， 代 人 码 如 下 : 


type Field struct { 


ClassMember 
constValueIndex uint 
slotId uint 


修改 newFields () 方法 ， 从 字段 属性 表 中 读 
取 constValueIndex， 代 码 改 动 如 下 : 


func newFields(class *Class, cfFields 
[]j*classfile.MemberInfo) []*Field { 
fields := make([]*Field, len(cfFields)) 
for i, cfField := range cfFields { 
fields[i] = &Field{} 
fields[i].class = class 
fields[i].copyMemberIinfo(cfField) 
fields[i].copyAttributes(cfField) 


return fields 


copyAttributes () 方法 的 代码 如 下 : 


func (self *Field) copyAttributes(cfField 
*classfile.MemberInfo) { 

if valAttr := cfField.ConstantValueAttribute(); valAttr 
I= nil { 


self.constValueIndex = 
uint(valAttr.ConstantValueIndex()) 
} 
} 


MemberInfo 结 构 体 的 ConstantValueIndex () 
方法 在 ch06\classfilemember_info.go 文 件 中 ， 代 码 
中 


func (self *MemberInfo) ConstantValueAttribute() 
*ConstantValueAttribute { 
for _, attrIinfo := range self.attributes { 
switch attrInfo,(type) { 
case *ConstantValueAttribute: 
return attrIinfo.(*ConstantValueAttribute) 
} 
} 


return nil 


6.5 ”类 和 字段 从 号 引用 解析 


本 玫 讨 论 类 符号 引用 和 字段 竺 号 引用 的 解 
析 ， 方 法 符号 引用 的 解析 将 在 第 7 章 讨论 。 


6.5.1 类 从 号 引用 解析 


打开 cp_symref.go 文 件 ， 在 其 中 定义 
ResolvedClass () 方法 ， 代 码 如 下 : 


func (self *SymRef) ResolvedClass() *Class { 
If self.class == nil 
self.resolveClassRef() 


return self.class 


} 


如 采 类 符号 引用 已 经 解析 ，ResolvedClass 
() 方法 直接 返回 类 指针 ， 否 则 调用 
resolveClassRef () 方法 进行 解析 。Java 虚 拟 机 规 
范 5.4.3.1 广 给 出 了 类 符号 引用 的 解析 步 又 ， 
resolveClassRef () 方法 就 是 按照 这 个 步骤 编写 的 
(有 一 些 简化 ， 代 码 如 下 : 


func (self *SymRef) resolveClassRef() { 
d := self.cp.class 


c := d.1loader.LoadClass(self.className) 
if Ic.isAccessibleTo(d) { 


panic("java.lang.IllegalAccessError") 


self.class = C 


通俗 地 讲 ， 如 果 类 DD 通过 从 号 引用 N35 引用 类 C 


的 话 ， 要 解析 N， 先 用 D 的 类 加 载 器 加 载 C， 然 后 
检查 D 是 否 有 权限 访问 C， 如 果 没 有 ， 则 抛 出 
IllegalAccessError 有 异常 。Java 虚 拟 机 规范 5.4.4 区 给 
出 了 类 的 访问 控制 规则 ， 把 这 个 规则 翻译 成 Class 
结构 体 的 isAccessibleTo () 方法 


， 代 码 如 下 (在 
class.go 文 件 中 ) : 


func (self *Class) isAccessibleTo(other *Class) bool { 


return self.IsPublic() || self.getPackageName() == 
other .getPackageName() 


} 


也 就 是 说 ， 如 果 类 D 想 访问 类 C， 需 要 满足 两 
个 条 件 之 一 : C 是 public， 或 者 C 和 D 在 同一 个 运行 
时 包 内 。 第 11 章 再 讨论 运行 时 包 ， 这 里 移 简单 按 
照 包 名 来 检查 。getPackageName () 方法 的 代码 
如 下 (也 在 class.go 文 件 中 ) : 


func (self *Class) getPackageName() String { 
if i := strings.LastIindex(self.name, "/"); i >= 0 { 
return self.name[:i] 


} 


return "" 


比如 类 名 是 java/lang/Object， 则 它 的 包 名 就 
是 java/lang。 如 来 类 定义 在 默认 包 中 ， 它 的 包 名 


6.5.2 ”字段 符号 引用 解析 


打开 cp_fieldref.go 文 件 ， 在 其 中 定义 
ResolvedField () 方法 ， 代 码 如 下 : 


func (self *FieldRef) ResolvedField() *Field { 
If self.field == nil { 
self.resolveFieldRef() 


return self.field 


} 


ResolvedField () 方法 与 ResolvedClass () 
方法 大 同 小 异 ， 丈 不 多 解释 了 。Java 虚 拟 机 规范 
5.4.3.2 帮 给 出 了 字段 符号 引用 的 解 术 步骤， 把 它 
翻译 成 resolveFieldRef () 方法 ， 代 码 如 下 : 


func (self *FieldRef) resolveFieldRrRef() { 


d := self.cp.class 
c := self.ResolvedClass() 
field := lookupField(c, self.name, self.descriptor) 


if field == nil { 
panic("java.lang.NoSuchFieldError") 


if !field.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


} 
self.field = field 


如 朱 类 D 想 通过 字段 符号 引用 访问 类 C 的 茶 个 
字段 ， 自 先 要 解析 和 从 号 引 用 得 到 类 C， 然 后 根据 
字段 名 和 挡 述 从 查找 字段 。 如 末 字 段 查 找 失 败 ， 
则 虚拟 机 抛 出 NoSuchFieldError 腊 常 。 如 果 查 找 成 
功 ， 但 DD 没有 足够 的 权限 访问 该 字段 ， 则 虚拟 机 
抛 出 HlegalAccessError 异 常 。 字 段 查 找 步 又 在 
lookupField () 范 数 中 ， 代 码 如 下 : 


func lookupField(c *Class, name, descriptor string) *Field { 
for _, field := range c.fields { 
if field.name == name && field.descriptor == 
descriptor { 
return field 


for _, iface := range c.interfaces { 
if field := lookupField(iface, name, descriptor); 
field != nil { 
return field 


} 


if c.superClass != nil { 


return lookupField(c.superClass, name, descriptor) 


return nil 


} 


目 先 在 C 的 字段 中 查找。 如 末 找 不 到 ， 在 C 的 
直接 接口 递归 应 用 这 个 查找 过 程 。 如 果 还 找 不 到 
的 话 ， 在 C 的 超 类 中 递归 应 用 这 个 查找 过 程 。 如 
果 仍 然 找 不 到 ， 则 伍 找 失败 。Java 虚 拟 机 规范 
5.4.4 广 也 给 出 了 字段 的 访问 控制 规则 。 这 个 规则 
同样 也 适用 于 方法 ， 所 以 把 它 〈 略 做 简化 ) 实现 
成 ClassMember 结 构 体 的 isAccessibleTo () 方 
法 ， 代 码 如 下 〈 在 class_member.go 文 件 中 ) : 


func (self *ClassMember) isAccessibleTo(d *Class) bool { 
If self.IsPublic() { 
return true 
} 
c := self.class 
If self.IsProtected() { 
return d == c || d.isSubClassof(c) || 
c.getPackageName() == d.getPackageName() 


} 
If !self.IsPrivate() { 
return c.getPpackageName() == d.getPackageName() 


} 


return d == C 


} 


用 通俗 的 语言 朱 述 字段 访问 规则 。 如 采 字 段 
和 是 public， 则 任何 类 都 可 以 访问 。 如 有 朱 字 段 是 
protected， 则 只 有 子 类 和 同一 个 包 下 的 类 可 以 访 
问 。 如 果 字 段 有 默认 访问 权限 ( 非 public， 非 
protected， 也 非 privated) ， 则 只 有 同一 个 包 下 的 
类 可 以 访问 。 人 和 否则， 字段 是 private， 只 有 声明 这 
个 字段 上 的 类 才能 访问 。 


6.6 ”类 和 对 和 象 相 天 指令 


本 节 将 实现 10 条 类 和 对 象 相关 的 指令 。new 
日 令 用 来 创建 类 实例 ，putstatic 和 getstatic 指 令 用 
于 存 取 静态 变量 ;putfield 和 getfield 用 于 存 取 实例 
变量 ; instanceof 和 checkcast 指 令 用 于 判断 对 象 是 
售 属 于 某 种 类 型 ; ldc 系 列 指令 把 运行 时 种 量 池 中 
的 音量 推 到 操作 数 栈 项 。 下 面 的 Java 代 码 演示 了 
Es 


i 


public class MyObject { 
public static int staticVar; 
public int instanceVar ; 
public static void main(String[] args) { 


int x = 32768 // ldc 

MyObject my0bj = new MyObject(); // new 
MyObject.staticVar = x; // putstatic 

x = MyObject.staticVar; // getstatic 
my0Obj.instanceVar = x; // putfield 

x = my0bj.instanceVar; // getfield 
Object obj = my0bj; 

if (obj instanceof MyObject) { // instanceof 


myobj = (MyObject) obj; // checkcast 


上 面 提 到 的 指令 除 ldc 以 外 ， 都 属于 引用 类 指 
令 ， 在 ch06\instructions 目 永 下 创建 references 子 目 
孙 来 存放 引用 类 指令 。 有 首先 实现 new 指 令 。 


6.6.1 new 指 令 


注意 ，new 指 令 专 门 用 来 创建 类 实例 。 数 组 
由 专门 的 指令 创建 ， 在 第 8 章 中 实现 数组 和 数组 相 
关 指 令 。 在 ch0G\instructions\references 目 录 下 创建 
new.go 文 件 ， 在 其 中 实现 new 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/cho6/instructions/base" 
import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Create new object 

type NEW struct{ base.Index16Instruction } 


new 指 令 的 操作 数 是 一 个 uint16 索 引 ， 来 目 字 
广 码 。 通 过 这 个 索引 ， 可 以 从 当前 类 的 运行 时 常 
量 池 中 找到 一 个 类 符号 引用 。 解 析 这 个 类 符号 引 
用 ， 拿 到 类 数据 ， 然 后 创建 对 象 ， 并 把 对 象 引 用 


推 入 栈 顶 ，new 指 令 的 工作 天 完成 了 。Execute 
() 方法 的 代码 如 下 : 


func (self *NEW) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedcClass() 
if class.IsIinterface() || class.IsAbstract() { 
panic("java.lang.InstantiationError") 


ref := class.NewObject() 
frame.OperandStack().PushrRef(ref) 


因为 接口 和 抽象 类 都 不 能 实例 化 ， 所 以 如 采 
解析 后 的 类 十 接口 或 抽象 类 ， 按 照 Java 虚 拟 机 规 
范 规定 ， 需 要 抛 出 InstantiationError 异 常 。 另 外 ， 
如 采 解 机 后 的 类 还 没有 初始 化 ， 则 需要 移 初 始 化 
类 。 在 第 7 章 实 现 方法 调用 之 后 会 详细 讨论 类 的 初 

台 化 ， 这 里 和 暂时 先 忽略 。Class 结 构 体 的 
NewObject () 方法 如 下 (在 class.go 文 件 中 ) : 


func (self *Class) NewObject() *Object { 
return newObject(self) 


} 


这 里 只 是 调用 了 Object 结构 体 的 newObject 
() 方法 ， 代 码 如 下 (在 object.go 中 ) : 


func newObject(class *Class) *Object { 
return &Object{ 
class: class, 
fields: newSlots(class.instanceSlotCount), 
} 
} 


新 创建 对 象 的 实例 变量 都 应 该 赋 好 初始 值 ， 
不 过 并 不 需要 做 额外 的 工作 ， 具 体 原 因 前 面 已 经 
讨论 过 ， 此 处 不 再 资 述 。new 指 令 实 现 好 了 ， 下 
面 看 看 如 何 存 取 类 的 静态 变量 。 


6.6.2 ”pnutstatic 和 getstatic 招 令 


在 references 目 永 下 创建 putstatic.go 文 件 ， 在 
其 中 实现 putstatic 指 令 ， 代 码 如 下 : 


package references 

Import "jvmgo/vcho6/instructions/Xbase” 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Set static field in class 

type PUT_STATIC struct{ base.Index1i6Instruction } 


putstatic 指 令 给 类 的 茶 个 静态 变量 风 值 ， 它 需 
要 两 个 操作 效 。 第 一 个 操作 数 征 uint16 索 5| ， 来 目 
字 市 码 。 通 过 这 个 索引 可 以 从 当前 类 的 运行 时 党 
量 池 中 找到 一 个 字段 符号 引用 ， 解 析 这 个 符号 3 引 
用 束 可 以 知道 要 给 类 的 哪个 前 仿 变 量 赋值 。 
个 操作 效 是 要 赋 给 静态 变量 的 值 ， 从 操作 数 栈 中 


弹出 。Execute () 方法 稍微 有 些 复杂 ， 分 三 部 分 


J 


介绍 : 


func (self *PUT_STATIC) Execute(frame *rtda.Frame) { 


currentMethod := frame.Method() 

currentClass := currentMethod.Class() 

cp := currentClass.ConstantPool() 

fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 

class := field.Class() 


先 拿 到 当前 方法 、 当 前 类 和 当前 弟 量 池 ， 然 


后 解析 字段 符号 引用 。 如 末 声 明子 段 的 类 还 没有 
饿 切 始 化 ， 则 需要 先 初 始 化 该 类 ， 这 部 分 逻辑 将 
在 第 7 章 实现 。 继 续 看 代码 : 


if 


} 
if 


Ifield.IsStatic() { 
panic("java.lang.IncompatibleClasschangeError") 


field.IsFinal() { 
if currentClass != class || currentMethod.Name() != " 


<clinit>" { 


panic("java.lang.IllegalAccessError") 


如 朱 解 术 后 的 字段 是 实例 字段 而 非 静 仿 字 
段 ， 则 抛 出 IncompatibleClassChangeError 异 常 。 
如 果 古 final 字 段 ， 则 实际 操作 的 是 静态 常量 ， 只 
能 在 类 初始 化 方法 中 给 它 周 值 。 否 则 ， 会 抛 出 
IllegalAccessError 寞 第 。 类 初始 化 方法 由 编译 大 生 
成 ， 名 字 是 <dlinit>， 具 体 请 看 第 7 革 。 继 续 看 代 
码 : 


descriptor := field.Descriptor() 
slotId := field.SlotId() 


slots := class.StaticVars() 

stack := frame.OperandStack() 

Switch descriptor[0] { 

case 'Z', 'B', 'C', 'S', 'I': Slots.SetInt(SLotId ， 
stack. PopInt()) 

case 'F': slots.SetFloat(slotId, stack.PopFloat()) 

case 'J': slots.SetLong(slotId, stack.PopLong()) 

case 'D': slots.SetDouble(slotId, stack.PopDouble()) 

case 'L', '[': slots.SetRef(slotId, stack.PopRef()) 


} 
} 


根据 字段 类 型 从 操作 数 栈 中 弹出 相应 的 值 ， 
然后 赋 给 静态 变量 。 至 此 ，Ppnutstatic 指 令 束 解释 完 


毕 了 。getstatic 指 令 和 pnutstatic 正 好 相反 ， 它 取出 
类 的 某 个 静态 变量 值 ， 然 后 推 入 栈 硕 。 在 
references 目 杂 下 创建 getstatic.go 文 件 ， 在 其 中 实 
现 getstatic 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/ch0o6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Get static field from class 

type GET_STATIC struct{ base.Index16Instruction } 


getstatic 指 令 只 需要 一 个 操作 数 : uint16 名 量 


池 索 引 ， 用 法 和 putstatic 一 样 ， 代 人 码 如 下 : 


func (self *GET_STATIC) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef .ResolvedField() 
class := field.Class() 
If !field.IsStatic() { 
panic("java.lang.IncompatibleClasschangeError") 


如 朱 解 析 后 的 字段 不 是 静态 字段 ， 也 要 抛 出 
IncompatibleClassChangeError 异 常 。 如 果 声 明 字 
段 的 类 还 没有 初始 化 好 ， 也 需要 先 初 始 化 。 
getstatic 只 是 读 取 静态 变量 的 值 ， 自 然 也 就 不 用 管 
它 是 否 是 final 了 。 继 续 看 剩 下 的 代码 : 


descriptor := field.Descriptor() 
SlotId := field.SlotId() 
Slots := class.StaticVars() 


stack := frame.OperandStack() 
Switch descriptor[0] { 
case 2 FB 1 1 “SS We 
stack.PushInt(slots.GetIint(slotId)) 
case 'F': stack.PushFloat(slots.GetFloat(slotId)) 
case 'J': Stack.PushLong(slots.GetLong(slotId)) 
case 'D': stack.PushDouble(slots.GetDouble(slotId)) 
case 'L', '[': stack.PushRef(slots.GetRef(slotId)) 
} 
} 


根据 字段 类 型 ， 从 静态 变量 中 取出 相应 的 
值 ， 然 后 推 入 操作 数 栈 顶 。 至 此 ，getstatic 指 令 也 
解释 完 竺 了 。 下面 介绍 如 何 存 取 对 象 的 实例 变 


| 王 | 


时 


6.6.3 ”putfield 和 getfield 指 令 


人 在 references 日 好 下 创建 putfield.go 文 件 ， 在 其 
中 实现 putfield 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/ch0o6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Set field in object 

type PUT_FIELD struct{ base.Index1i6Instruction } 


putfield 指 令 给 实例 变量 赋值 ， 它 需要 三 个 操 
作 数 。 前 两 个 操作 数 古 常量 池 索 引 和 变量 值 ， 用 
法 和 pnutstatic 一 样 。 第 三 个 操作 数 是 对 象 引 用 ， 从 
操作 数 栈 中 弹出 。 同 样 分 三 次 来 介绍 putfield 指 令 
的 Execute () 方法 ， 第 一 部 分 代码 如 下 : 


func (self *PUT_FIELD) Execute(frame *rtda.Frame) { 
currentMethod := frame.Method() 
currentClass := currentMethod.cClass() 
cp := currentClass.ConstantPool() 


fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 


基本 上 和 pnutstatic 一 样 ， 这 里 了 驶 不 多 解释 了 。 
有 下 一 人 ph 分: 


HK 


cp-: 


f field,.IsSstatic() { 
panic("java.lang.IncompatibleClasschangeError") 


Pr 


f field.IsFinal() { 

if currentClass != field,Class() || currentMethod.Name() 
I= "<init>" { 
panic("java.lang.IllegalAccessError") 


看 起 来 也 和 putstatic 差 不 多 ， 但 有 两 点 不 辣 
(在 代码 中 已 经 加 粗 ， 。 第 一 ， 解 析 后 的 字段 必 
须 是 实例 字段 ， 人 否则 抛 出 
IncompatibleClassChangeError。 第 二 ， 如 果 是 final 
字段 ， 则 只 能 在 构造 国 数 中 初始 化 ， 否 则 抛 出 
IllegalAccessError。 在 第 7 革 会 介绍 构造 画 数 。 下 
面 看 剩 下 的 代码 : 


descriptor := field.Descriptor() 

SlotId := field.SlotId() 

stack := frame.OperandStack() 

Switch descriptor[0] { 

Case an iB! en SU 
val := stack.PopInt() 
ref := Stack.PopRef() 
if ref == nil { 

panic("java.lang.NullPointerException") 


LE 


ref.Fields().SetIint(slotId, val) 
case 'F': ... 

Case 'J': ... 

case 'D': ... 

case 'L', "'[': ... 


} 


完 根据 字段 类 型 从 操作 数 栈 中 弹出 相应 的 变 
量 值 ， 然 后 弹出 对 和 象 引 用 。 如 果 引 用 是 null， 需 
抛 出 著名 的 空 指针 有 寞 冰 

(NullPointerException) ， 否 则 通过 引用 给 实例 
变量 赋值 。 其 他 的 case 语 句 和 第 一 个 大 同 小 异 ， 
为 了 节约 篇 幅 ， 省 略 了 详细 代码 。 


putfield 指 令 解 释 完 毕 ， 下 面 来 看 getfield 指 
令 。 在 references 目 永 下 创建 getfield.go 文 件 ， 在 其 
中 实现 getfield 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Fetch field from object 

type GET_FIELD structt{ base.Index1i6Instruction } 


getfield 指 令 获取 对 象 的 实例 变量 值 ， 然 后 推 
入 操作 数 栈 ， 它 需要 两 个 操作 数 。 第 一 个 操作 数 
是 uint16 索 引 ， 用 法 和 前 面 三 个 指令 一 样 。 第 二 个 
操作 数 是 对 象 引 用 ， 用 法 和 putfield 一 样 。 下 面 看 
看 getfield 指 令 的 Execute 方 法 () ， 第 一 部 分 代码 
如 下 : 


func (self *GET_FIELD) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
fieldRef := cp.GetConstant(self.Index).(*heap.FieldRef) 
field := fieldRef.ResolvedField() 
If field.IsStatic() { 


panic("java.lang.IncompatibleClasschangeError") 


引用 解析 。 这 部 分 逻辑 我 们 已 


stack := frame.OperandStack() 

ref := stack.PopRef() 

if ref == nil { 
panic("java.lang.NullPointerException") 


弹出 对 象 引 用 ， 如 宁 是 null， 则 抛 出 
NullPointerException。 剩 下 的 代码 如 下 : 


descriptor := field.Descriptor() 
SlotId := field.SlotId() 
slots := ref.Fields() 
Switch descriptor[0] { 
case “ZZ." > 'B', Co SS i 

stack. PushInt(slots， GetInt(slotId)) 
case 'F': stack.PushFloat(slots.GetFloat(slotId)) 
case 'J': stack.PushLong(slots.GetLong(slotId)) 
case 'D': stack.PushDouble(slots.GetDouble(slotId)) 
case 'L', '[': stack.PushRef(slots.GetRef(slotId)) 
} 

} 


根据 字段 尖 型 ， 获 取 相 应 的 实例 变量 值 ， 然 
后 推 入 操作 数 栈 。 至 此 ，getfield 指 令 也 解释 完毕 


了 。 下 面 讨 论 instanceof 和 checkcast 指 令 。 


6.6.4 ”instanceof 和 checkcast 指 令 


instanceof 指 令 判 断 对 象 是 否 是 某 个 类 的 实例 
(或 者 对 象 的 类 是 否 实现 了 某 个 接口 ) ， 并 把 结 
朱 推 入 操作 效 栈 。 在 references 目 永 下 创建 
instanceof.go 文 件 ， 在 其 中 实现 instanceof 指 令 ， 代 
人 码 如 下 : 


package references 

import "jvmgo/ch0o6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Determine if object is of given type 

type INSTANCE_OF struct{ base.Index1i6Instruction } 


instanceof 指 令 需 要 两 个 操作 数 。 第 一 个 操作 
数 是 uint16 索 3 引 ， 从 方法 的 子 丰 人 码 中 获取 ， 通 过 这 
个 索引 可 以 从 当前 类 的 运行 时 常量 池 中 找到 一 个 
关 符 吕 引 用 。 第 二 个 操作 数 生 对 象 引 用 ， 从 操作 


数 栈 中 弹出 。instanceof 指 令 的 Execute () 方法 如 
下 : 


func (self *INSTANCE_OF) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
ref := stack.PopRef() 
if ref == nil { 
stack.PushIint(0) 
return 


cp := frame.Method(),Class().ConstantPool() 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedcClass() 
if ref.IsInstanceof(class) { 
stack.PushInt(1) 


} else { 
stack.PushIint(0) 


先 弹 出 对 象 引 用 ， 如 有 末 是 null， 则 把 0 推 入 操 
作 数 栈 。 用 Java 代 码 解释 束 是 ， 如 有 果 引 用 obj 是 
null 的 话 ， 不 管 ClassYYY 是 哪 种 类 型 ， 下 面 这 条 if 
判断 都 是 false: 


if (obj instanceof ClassYYY) {...} 


如 果 对 象 引 用 不 是 null， 则 解析 类 符号 引用 ， 
判断 对 象 是 否 是 类 的 实例 ， 然 后 把 判断 线条 推 入 
操作 数 栈 。Java 虚 拟 机 规范 给 出 了 具体 的 判断 步 
又 ， 我 们 在 Object 结构 体 的 IImstanceOf () 方法 
中 实现 ， 稍 后 给 出 代码 。 下 面 来 看 checkcast 指 
令 。 在 references 目 杂 下 创建 checkcast.go 文 件 ， 在 
其 中 实现 checkcast 指 令 ， 代 码 如 下 : 


package references 

import "jvmgo/ch0o6/instructions/base" 

import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 

// Check whether object is of given type 

type CHECK_CAST struct{ base.Index16Instruction } 


checkcast 指 令 和 instanceof 指 令 很 像 ， 区 别 在 
于 : instanceof 指 令 会 改变 操作 数 栈 (弹出 对 象 引 
用 ， 推 入 判断 结果 ) ; checkcast 则 不 改变 操作 数 


栈 (如 采 判 断 失 败 ， 直 接 抛 出 ClassCastException 
异常 ) 。checkcast 指 令 的 Execute () 方法 如 下 : 


func (self *CHECK_CAST) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
ref := stack.PopRef() 
stack.PushRef (ref) 
if ref == nil { 
return 


cp := frame.Method(),Class().ConstantPool() 

classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 

class := classRef.ResolvedcClass() 

if !ref.ISInstanceof(class) { 
panic("java.lang.ClassCastException") 


先 从 操作 数 栈 中 弹出 对 象 引 用 ， 再 推 回 去 ， 
这 样 束 不 会 改变 操 作 数 栈 的 状态 。 如 末 引 用 且 
null， 则 指令 执行 结束 。 也 就 是 说 ，null 引 用 可 以 
转换 成 任何 类 型 ， 否 则 解析 类 符号 引用 ， 判 断 对 
象 是 否 是 类 的 实例 。 如 果 是 的 话 ， 指 令 执行 结 
束 ， 否 则 抛 出 ClassCastException。instanceof 和 


checkcast 指 令 一 般 都 是 配合 使 用 的 ， 像 下 面 的 
Java 代 人 码 这 样 : 


if (xxx instanceof ClassYYY) { 
yyy = (ClassYYY) xxx; 
// Use yyy 


Object 结 构 体 的 IsInstanceOf () 方法 的 代码 
如 下 (在 object.go 文 件 中 ) : 


func (self *Object) IsInstanceOof(class *Class) bool { 
return class.isAssignableFrom(self.class) 


真正 的 逻辑 在 Class 结 构 体 的 isAssignableFrom 

() 方法 中 ， 这 个 方法 稍微 有 些 复杂 ， 为 了 避免 
ass80 文 作 要 得 过 长 把 和 它 与 答 芳 一 个 天 件 中 
en 目录 下 创建 class_hierarchy.go 文 


件 ， 在 其 中 定义 isAssignableFrom () 方法 ， 代 码 
ul 


func (self *Class) isAssignableFrom(other *Class) bool { 
s, t := other, self 
if s == tH{ 
return true 
} 
if !t.ISInterface() { 
return s.isSubClassof(t) 
} else { 
return s.isImplements(t) 


} 
} 


也 束 是 说 ， 在 三 种 情况 下 ，S 类 型 的 引用 值 可 
以 赋值 给 IT 关 型 : S 和 T 是 同一 撩 型， I 征 天 且 S 是 T 
的 子 类 ;或 者 T 是 接口 且 S 实 现 了 T 接 口 。 这 是 简 
化 版 鸭 判断 还 辑 ， 因 为 还 没有 实现 数组 ， 第 8 章 讨 
论 数 组 时 会 继续 完善 这 个 方法 。 继 续 编 辑 
class_hierarchy.go 文 件 ， 在 其 中 实现 isSubClassOf 

U 方法 ， 代 码 如 下 : 


func (self *Class) isSubClassof(other *Class) bool { 
for c := self.superClass; c != nil; c = c.superClass { 
if c == other { 
return true 


return false 


} 


判断 S 是 否 是 I 的 和子 类 ， 实 际 上 也 允 是 判断 
是 否 是 S 的 (直接 或 间接 ) 超 类 。 继 续 编辑 
class_hierarchy.go 文 件 ， 在 其 中 实现 isImplements 
(方法 ,代码 如 下 : 


func (self *Class) isImplements(iface *Class) bool { 
for c := self; c != nil; c = c.superClass { 
for _, i := range c.interfaces { 
if i == iface || i.isSubInterfaceof(iface) { 
return true 
} 
} 


return false 


判断 S 是 否 实现 了 T 接 口 ， 束 看 S 或 的 (直接 
或 间接 ) 超 类 是 否 实现 了 某 个 接口 T'，T' 要 么 十 


T， 要 么 是 IT 的 子 接口 。isSubInterfaceOf () 方法 
也 在 class_hierarchy.go 文 件 中 ， 代 人 码 如 下 : 


func (self *Class) isSubInterfaceOof(iface *Class) bool { 
for _, superIinterface := range self.interfaces { 
if superIinterface == iface || 
superIinterface.isSubInterfaceof(iface) { 
return true 


return false 


} 


isSubInterfaceOf () 方法 和 isSubClassOf () 
方法 类 似 ， 但 是 用 到 了 递归 ， 这 里 不 多 解释 了 。 
到 此 为 止 ，instanceof 和 checkcast 指 令 束 介绍 完毕 


了 ， 下 面 来 看 ldc 指 令 。 


6.6.5 “ldc 指 令 


ldc 系 列 指令 从 运行 时 篆 量 池 中 加 载 和 营 量 但， 
并 把 它 推 入 操作 数 栈 。ldc 系 列 指令 属于 当量 类 指 
令 ， 共 3 条 。 其 中 ldc 和 ldc_w 指 令 用 于 加 载 int 、 
float 和 字符 串 常量 ，java.lang.Class 实 例 或 者 
MethodType 和 MethodHandle 实 例 。ldc2_w 指 令 用 
于 加 载 long 和 double 常 量 。ldc 和 1ldc_w 指 令 的 区 别 
仅 在 于 操作 数 的 加 度 。 


本 章 只 处 理 int、float、long 和 double 常 量 。 第 
8 章 实 现 数组 和 字符 串 之 后 ， 会 进一步 完善 ldc 指 
令 ， 支 持 字符 串 常 量 的 加 载 。 第 9 章 还 会 继续 完善 


1dc 指 令 ， 文 持 Class 实 例 的 加 载 。 本 书 不 讨论 


MethodType 和 MethodHandle， 感 兴趣 的 读者 请 参 
考 Java 庶 拟 机 规范 的 相关 章节 。 


在 ch06\instructions\constants 目 永 下 创建 ldc.go 
文件 ， 在 其 中 定义 ldc、1dc_w 和 1dc_2w 指 令 ， 代 
代 如 下 : 


package constants 

import "jvmgo/ch0o6/instructions/base" 

import "jvmgo/cho6/rtda" 

type LDC struct{ base.Index8Instruction } 
type LDC W struct{ base.Index1i6Instruction } 
type LDC2 W struct{ base.Index1i6Instruction } 


ldc 和 ldc_w 指 令 的 逻辑 完全 一 样 ， 在 _ldc ( 
函数 中 实现 ， 代 码 如 下 : 


func (self *LDC) Execute(frame *rtda.Frame) { 
_ldc(frame, self.Index) 


func (self *LDC W) Execute(frame *rtda.Frame) { 
_ldc(frame, self.Index) 
} 


_ldc () 男 数 的 代码 如 下 : 


func _ldc(frame *rtda.Frame, index uint) { 


stack := frame.OperandStack() 
cp := frame.Method().cCclass().ConstantPool() 
c := cp.GetConstant(index) 


Switch c.(type) { 
case int32: stack.PushIint(c.(int32)) 
case float32: stack.PushFloat(c. (float32)) 


生生 


// case string: 在 第 


8 章 实现 


// case *heap,ClassRef: 在 第 


9 章 实现 


default: panic("todo: ldc!") 


完 从 当前 类 的 运行 时 第 量 池 中 取出 音量 。 如 
果 是 int 或 float 肖 量 ， 则 提取 出 常量 值 ， 则 推 入 操 
作 数 栈 。 其 他 情况 还 无 法 处 理 ， 和 暂时 调用 panic 
() 玉 数 终止 程序 执行 。]ldc_2w 指 令 的 Execute 
() 方法 单独 实现 ， 代 码 如 下 : 


func (self *LDC2_W) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
cp := frame.Method().Class().ConstantPool() 
c := cp.GetConstant(self.Index) 
Switch c,(type) { 
case int64: stack.PushLong(c. (int64)) 
case float64: stack.PushDouble(c. (float64)) 
default: panic("java.lang.ClassFormatError") 


代码 比较 简单 ， 不 多 解释 ， 这 里 重 扣 说 一 下 
Frame 结 构 体 的 Method () 方法 。 为 了 通过 frame 
变量 拿 人 下 当前 类 的 运行 时 第 量 池 ， 给 Frame 结 构 体 
添加 了 method 字 上段， 代码 如 下 : 


type Frame struct { 


Jower *Frame 
localVars LocalVars 
operandStack *OperandStack 
thread *Thread 
method *heap.Method 
neXxtPC int 


Method () 是 Getter 方 法 ， 就 不 给 出 代码 
了 。newFrame () 函数 有 相应 变化 ， 代 码 如 下 : 


func newFrame(thread *Thread, method *heap .Method) *Frame { 
return &Framet 


thread : thread, 

method: method, 

localVars: newLocalVars(method.MaxLocals()), 
operandStack: newoperandStack(method ,MaxStack( )), 


到 此 ， 类 和 对 和 象 相 关 的 10 条 指令 都 实现 好 
了 。 最 后 还 需要 修改 ch06\instructions\factory.go 文 
件 ， 在 其 中 添加 这 些 指 令 的 case 语 句 。 具 体 改 动 
也 比较 简单 ， 这 里 豆 不 给 出 代码 了 。 


6.7 ”测试 本 章 代 码 


打开 ch06\main.go 文 件 ， 修 改 import 语 句 ， 代 
人 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/cho6/classpath" 
import "jvmgo/cho6/rtda/heap" 


main () 画 数 不 变 ， 删 掉 其 他 画 数 ， 然 后 修 
改 starUVM () 画 数 ， 代 码 如 下 : 


func startJVM(cmd *Cmd) { 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
classLoader := heap.NewClassLoader (cp) 

className := strings.Replace(cmd.class, ".", "/", -1) 
mainClass := classLoader.LoadClass(classNanme) 
mainMethod := mainClass.GetMainMethod() 


If mainMethod != nil { 
interpret (mainMethod) 
} else { 
fmt.Printf("Main method not found in class %s\n", 
cmd.class) 


} 
3: 


完 创建 ClassLoader 实 例 ， 然 后 用 它 来 加 载 主 
类 ， 最 后 执行 主 类 的 main () 方法 。Class 结 构 体 
的 GetMainMethod () 方法 如 下 (在 
ch06\rtda\heap\class.go 文 件 中 ) 


func (self *Class) GetMainMethod() *Method { 
return self.getSstaticMethod("main", " 
([Ljava/lang/String; )V") 


\ 是 调用 了 getStaticMethod () 方法 而 已 ， 
代码 如 下 : 


func (self *Class) getStaticMethod(name, descriptor string) 
*Method { 
for _, method := range self.methods { 
If method.IsStatic() && 
method .name == name && method.descriptor == 
descriptor { 
return method 


} 


return nil 


区 


接 下 来 编 辑 ch06\interpreter.go 文 件 ， 修 改 
import 语 句 ， 代 人 码 如 下 : 


package main 

import "fmt" 

import "jvmgo/cho6/instructions" 
import "jvmgo/cho6/instructions/base" 
import "jvmgo/cho6/rtda" 

import "jvmgo/cho6/rtda/heap" 


其 他 函数 不 变 ， 只 修改 interpret () 男 数 ， 代 
人 码 如 下 : 


func interpret(method *heap.Method) { 
thread := rtda.NewThread() 
frame := thread,NewFrame(method ) 
thread.PushFrame(frame) 
defer catchErr(frame) 
loop(thread, method.Code()) 


Thread 结 构 体 的 NewFrame () 方法 如 下 (在 
ch06\rtda\thread.go 文 件 中 ) : 


func (self *Thread) NewFrame(method *heap.Method) *Frame { 
return newFrame(self, method) 


在 编译 本 章 代码 之 前 ， 还 需要 添加 两 个 
hack。 因 为 对 象 是 需要 初始 化 的 ， 所 以 每 个 类 都 
至 少 有 一 个 构造 画 数 。 即 使 用 户 自 己 不 定义 ， 编 
译 絮 也 会 自动 生成 一 个 默认 构造 画 数 。 在 创建 类 
实例 时 ， 编 译 器 会 在 new 指 令 的 后 面 加 入 
invokespecial 指 令 来 调用 构造 畏 数 初始 化 对 象 。 要 
到 第 7 章 才 会 实现 invokespecial 指 令 ， 为 了 测试 
putfield 和 getfield 等 指令 ， 这 里 先 给 它 一 个 空 的 实 
现 。 在 ch06\instructions\references 目 录 下 创建 
invokespecial.go 文 件 ， 把 下 面 的 代码 复制 进去 : 


package references 

import "jvmgo/cho6/instructions/base" 

import "jvmgo/cho6/rtda" 

type INVOKE_ SPECIAL struct{ base.Index16Instruction } 

// hack! 

func (self *INVOKE_ SPECIAL) Execute(frame *rtda.Frame) { 
frame.OperandStack( ) .PopRef() 


第 5 章 通过 打印 局 部 变量 表 和 操作 数 栈 的 方式 
观察 计算 结 有 末 ， 这 样 很 不 方便 。 这 里 用 另外 一 个 
hack 来 解决 这 个 问题 。 在 
ch0G\instructions\references 目 录 下 创建 
invokevirtual.go 文 件 ， 把 下 面 的 代码 复制 进去 : 


package references 


import "fmt" 


import "jvmgo/cho6/instructions/base" 


import "jvmgo/cho6/rtda" 
import "jvmgo/cho6/rtda/heap" 
// Invoke instance method; dispatch based on class 
type INVOKE_ VIRTUAL struct{ base.Indexi6Instruction } 


// hack! 


func (self *INVOKE VIRTUAL) Execute(frame *rtda.Frame) { 
cp := frame.Method().class().ConstantPool() 


methodrRef 


if methodRef .Name() 
:= frame.Operandstack() 


stack 

Switch methodRef. 
case "(Z)V": fmt 
case "(C)V": fmt. 
case "(B)V": fmt. 
case "(S)V": fmt. 
case "(I)V": fmt 
case "(J)V": fmt. 
case "(F)V": fmt. 
case "(D)V": fmt. 


default: panic("println: 


} 
Stack .PopRef( ) 


Descriptor() { 
.Printf("%v\n", 


Printf("%c\n", 
Printf("%v\n", 
Printf("%v\n", 


.Printf("%v\n", 


Printf("%v\n", 
Printf("%v\n", 
Printf("%v\n", 


stack. 
stack. 
stack. 
stack. 
stack. 
stack. 
stack. 
stack. 
" + methodRef.Descriptor() ) 


:= cp.GetConstant(self.Index).(*heap.MethodRef) 
== "println" { 


PopInt() != 0) 
PopInt( ) ) 
PopInt( ) ) 
PopInt( ) ) 
PopInt( ) ) 
PopLong() ) 
PopFJLoat( ) ) 
PopDouble( )) 


至 于 这 两 个 hack 为 什么 可 以 起 作用 ， 请 阅读 
第 7 章 ， 在 那里 会 讨论 方法 调用 和 返回 。 有 了 上 面 
的 hack， 可 以 修改 6.6 小 牛 开 头 给 出 的 Java 例 子 ， 
添加 输出 语 可 ， 代 码 如 下 : 


package jvmgo.book.cho6 ; 
public class MyObject { 
public static int staticVar; 
public int instanceVar; 
public static void main(String[] args) { 


int x = 32768; // ldc 

MyObject myobj = new MyObject(); // new 

MyObject.staticVar = x; // putstatic 

x = MyObject.staticVar; // getstatic 

my0bj .instanceVar = x; // putfield 

x = myobj.instanceVar ; // getfield 

Object obj = myobj ; 

if (obj instanceof MyObject) { // instanceof 
myobj = (MyObject) obj; // checkcast 
System.out.printin(my0bj.instanceVar); 

} 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 


go install jvmgo\ch06 


命令 执行 完毕 后 ，D: \goWwworkspace\bin 目 杂 
会 出 现 ch06.exe 文 件 。 用 javac 编 译 MyObject 类 ， 然 
后 用 ch06.exe 执 行 MyObject 程 序 ， 结 果 如 图 6-3 和 
图 6-4 所 示 。 


k. ch06. NyOb ject 
[Loaded java/lange/Object from C:\Program Files\Java\irel. 8.0 66\1ib\rt. jar] 
[Loaded jvmeo/book/ch06/NyOb ject from D:\go\workspace\bin] 


pc: 0 inst:*constants. LDC &{{2}} 
c: 2 inst:*stores, ISTORE 1 &{# 
3 inst:*references. NEY &{{3}] 
6 inst:*stack. DUP &{0} 
了 
0 


inst:*references. INVOKE_SPECIAL &{{4}} 
inst :*stores. ASTORE 2 &{@} 


p 
pe: 
pe: 
be: 
pe 


图 6-3 ”MyObject 程 序 执行 结果 (1) 


pc:39 inst:*references.CHECK CAST &{{3}} 

pc:42 inst:*stores. ASTORE 2 &{{} 

pc:43 inst:*references. GET STATIC &{{7}} 

[Loaded java/lane/System from C:\Program Files\Java\irel. 8.0 66\1ib\rt. jar] 


pc:46 inst:*loads. ALOAD 2 &{0} 、 
47 inst:*references.GET_FIELD &{{6}} | 
c:50 inst:*references, INVYOKE_VIRTUAL &{{8}} 


D:\go\workspace\bin> 


图 6-4 MyObject 程 序 执行 结果 (2) 


6.8 本章 小 结 


本 章 实现 了 方法 区 、 运 行 时 第 量 池 、 类 和 对 
象 结构 体 、 一 个 向 单 的 类 加 载 絮 ， 以 及 ldc 和 部 分 
引用 类 指令 。 下 一 章 将 讨论 方法 调用 和 返回 ， 到 
时 吏 可 以 执行 更 加 复杂 的 方法 了 。 


第 7 革 方法 调用 和 返回 


第 4 章 实 现 了 Java 虚 拟 机 栈 、 帧 等 运行 时 数据 
区 ， 为 方法 的 执行 打 好 了 基础 。 第 5 革 实 现 了 一 个 
和 侧 单 的 解释 硼 和 150 多 条 指令 ， 已 经 可 以 执行 单个 
方法 。 第 6 草 实现 了 方法 区 ， 为 方法 调用 扫 清 了 障 
碍 。 本 章 将 实现 方法 调用 和 返回 ， 在 此 基础 上 ， 
还 会 讨论 类 和 对 和 象 的 初始 化 。 


开始 本 革 之 前 ， 还 是 先 把 目录 结构 准备 好 。 
复制 cna06 目 隶 ， 改 名 为 ch07。 修 改 main.go 等 
件 ， 把 import 语 句 中 的 ch06 全 都 蔡 换 成 h07。 本 章 
对 目 永 结构 没有 太太 的 调整 。 


7.1 方法 调用 概述 


从 调用 的 角度 来 看 ， 方 法 可 以 分 为 两 类 : 评 
态 方法 (或 者 类 方法 ) 和 实例 方法 。 静 态 方法 通 
过 类 来 调用 ， 实 例 方法 则 通过 对 象 引用 来 调用 。 
辣 仿 方法 生 静 仿 绑 定 的 ， 也 吏 生 说 ， 最 终 调 用 的 
侠 哪 个 方法 在 编译 期 束 已 经 确定 。 实 例 方法 则 文 
持 动 态 绑 定 ， 最 终 要 调用 哪个 方法 可 能 要 推迟 到 


运行 期 才能 知道 ， 本 章 将 详细 讨论 这 一 点 。 


从 实现 的 角度 来 看 ， 方 法 可 以 分 为 二 类 : 没 
有 实现 (也 就 是 抽象 方法 ) 、 用 Java 语 言 (或 者 
JVM 上 的 其 他 语言 ， 如 Groovy 和 和 Scala 等 ) 实现 和 
用 本 地 语言 (如 C 或 者 C++) 实现 。 静 态 方法 和 抽 
象 方法 是 互 斥 的 。 在 Java 8 之 前 ， 接 口 只 能 包含 抽 


象 方法 。 为 了 实现 Lambda 表 达 式 ，Java 8 放宽 了 
这 一 限制 ， 在 接口 中 也 可 以 定义 静态 方法 和 默认 
方法 。 本 章 不 考虑 接口 的 静态 方法 和 默认 方法 ， 
感 兴趣 的 读者 请 阅读 Java 虚 拟 机 规范 相关 章 记 。 
在 本 书 中 ， 我 们 把 Java 等 语言 实现 的 方法 叫 作 Java 
方法 。 本 章 只 讨论 Java 方 法 的 调用 ， 本 地 方法 调 
用 将 在 第 9 章 中 介绍 。 


在 Java 7 之 前 ，Java 虚 拟 机 规范 一 共 提供 了 4 
条 方法 调用 指令 。 其 中 invokestatic 指 令 用 来 调用 
静态 方法 。invokespecial 指 令 用 来 调用 无 须 动 态 绑 
定 的 实例 方法 ， 包 括 构 造 画 数 、 私 有 方法 和 通过 
super 天 键 字 调用 的 超 类 方法 。 剩 下 的 情况 则 属于 
动态 绑 定 。 如 宁 是 针对 接口 类 型 的 引用 调用 方 


法 ， 束 使 用 invokeinterface 指 令 ， 否 则 使 用 


invokevirtual 指 令 。 本 章 将 实现 这 4 条 指令 。 


为 了 更 好 地 文 持 动态 类 型 语言 ，Java 7 增加 了 
一 条 方法 调用 指令 invokedynamic。 本 章 不 讨论 这 
条 指令 ， 感 兴趣 的 读者 请 阅读 Java 虚 拟 机 规范 相 
天 章 帮 。 在 深入 讨论 各 条 方法 调用 指令 的 细 世 之 
前 ， 先 何 单 了 解 Java 虚 拟 机 是 如 何 调用 方法 的 。 


目 完 ， 方 法 调用 指令 需要 n+1 个 操作 数 ， 其 
中 第 1 个 操作 数 古 uint16 系 引 ， 在 字 广 人 码 中 烷 跟 在 
站 令 操作 人 码 的 后 面 。 通 过 这 个 索引 ， 可 以 从 当前 
类 的 运行 时 第 量 池 中 找到 一 个 方法 符号 引用 ， 解 
析 这 个 符号 引用 就 可 以 得 到 一 个 方法 。 注 意 ， 这 
个 方法 并 不 一 定 就 是 最 终 要 调用 的 那个 方法 ， 所 
以 可 能 还 需要 一 个 查找 过 程 才能 找到 最 终 要 调用 


的 方法 。 剩 下 的 n 个 操作 数 是 要 传递 给 被 调用 方法 
的 参数 ， 从 操作 数 栈 中 弹出 。 将 在 7.2 小 万 讨论 方 
法 符号 引用 的 解析 。 


如 果 要 执行 的 是 Java 方 法 〈 而 非 本 地 方 
法 ) ， 下 一 步 是 给 这 个 方法 创建 一 个 新 的 帧 ， 并 
把 它 推 到 Java 庶 拟 机 栈 顶 。 传 递 参数 之 后 ， 新 的 
方法 驶 可 以 开始 执行 了 。 将 在 7.3 小 世 讨 论 参 数 传 
递 ， 本 地 方法 调用 则 推迟 到 第 9 章 再 讨论 。 下 面 是 
一 段 伪 代码 ， 用 于 说 明 Java 方 法 的 调用 过 程 。 


func (self *INVOKE_XXX) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodRef) 
resolved := resolveMethodRef(methodRef ) 
checkResolvedMethod(resolved) 
toBeInvoked := findMethodToInvoke(methodRef ) 
newFrame := frame.Thread().NewFrame(toBeInvoked) 
frame.Thread().PushFrame(newFrame ) 
passArgs(frame, newFrame) 


方法 的 最 后 一 条 指令 是 某 个 返回 指令 ， 这 个 
指令 负责 把 方法 的 返回 值 推 入 前 一 帆 的 控 作 数 栈 
顶 ， 然 后 把 当前 帧 从 Java 虚 拟 机 栈 中 弹出 。 将 在 
7.4 小 了 讨论 返回 指令 ， 在 7.5 小 下 讨论 方法 调用 指 


令 。 


7.2 ”解析 方法 符号 引 用 


非 接口 方法 符号 引用 和 接口 方法 符号 引用 的 
解析 规则 是 不 同 的 ， 因 此 本 章 分 开 讨论 这 两 种 符 
写 引 用 。Java 虚 拟 机 规范 的 5.4.3.3 节 和 5.4.3.4 广 评 
细 描 述 了 这 两 种 符号 引用 的 解析 规则 。 由 于 本 书 
不 讨论 接口 的 静态 方法 和 默认 方法 ， 所 以 在 本 小 
节 中 ， 主 要 参考 Java 虚 拟 机 规范 第 7 版 编写 代码 ， 


请 读者 注意 这 一 点 。 


7.2.1” 非 接 口 方 法 符号 引用 


打开 ch07\rtda\heap\cp_methodref.go 文 件 ， 在 
其 中 实现 ResolvedMethod () 方法 ， 代 码 如 下 : 


func (self *MethodRef) ResolvedMethod() *Method { 
If self.method == nil { 
self.resolveMethodRef() 


return self.method 


如 果 还 没有 解析 过 符号 引用 ， 调 用 
resolveMethodRef () 方法 进行 解析 ， 否 则 直接 返 
回 方 法 指针 。resolveMethodRef () 方法 的 代码 如 
下 : 


func (self *MethodRef) resolveMethodRef() { 
d := self.cp.class 
c := self.ResolvedClass() 
if c.IsInterface() { 
panic("java.lang.IncompatibleClasschangeError") 


method := lookupMethod(c, self.name, self.descriptor) 


if method == nil { 
panic("java.lang.NoSuchMethodError") 


If Imethod.isAccessibleTo(d) 
panic("java.lang.IllegalAccessError") 


} 
self.method = method 


如 采 类 D 想 通过 方法 符号 引用 访问 类 C 的 某 个 
方法 ， 先 要 解析 符号 引用 得 到 类 C。 如 采 C 十 接 
口 ， 则 抛 出 IncompatibleClassChangeError 异 常 ， 
否则 根据 方法 名 和 搬 述 符 查 找 方法 。 如 采 找 不 到 
对 应 的 方法 ， 则 抛 出 NoSuchMethodError 异 常 ， 否 
则 检查 类 DD 是 否 有 权限 访问 该 方法 。 如 采 没 有 ， 
则 抛 出 TlegalAccessError 异 常 。isAccessibleTo () 
方法 是 在 ClassMember 结 构 体 中 定义 的 ， 在 第 6 章 
就 已 经 实现 了 。 下 面 看 一 下 lookupMethod () 画 
数 ， 其 代码 如 下 : 


func lookupMethod(class *Class, name, descriptor string) 
*Method { 


method := LookupMethodInCclass(class，name，descriptor ) 
if method == nil { 
method = lookupMethodInIinterfaces(class.interfaces, 
name, descriptor) 


return method 


. 


完 从 C 的 继承 层次 中 找 ， 如 果 找 不 到 ， 束 去 C 
的 接口 中 找 。LookupMethodInClass () 函数 在 很 
多 地 方 都 要 用 到 ， 所 以 在 
ch07\rtda\heap\method_lookup.go 文 件 中 实现 它 ， 
代码 如 下 : 


func LookupMethodIinClass(class *Class, name, descriptor 
string) *Method { 
for c := class; c != nil; c = c.superClass { 
for _, method := range c.methods { 
If method.name == name && method.descriptor == 
descriptor { 


} 
} 


return method 


return nil 


} 


lookupMethodInInterfaces () 函数 也 在 
method_lookup.go 文 件 中 ， 代 码 如 下 : 


func lookupMethodInIinterfaces(ifaces []*Cclass，name， 
descriptor string) *Method { 


for _, iface := range ifaces { 
for _, method := range iface.methods { 
If method.name == name && method.descriptor == 


descriptor { 
return method 


} 


method := lookupMethodIinInterfaces(iface.interfaces, 
name, descriptor) 
If method != nil { 
return method 
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return nil 


} 


至 此 ， 非 接口 方法 符号 引用 的 解析 束 介 绍 完 
了 ， 下 面 介绍 接口 方法 符号 引用 如 何 解 析 。 


To 月 


打开 ch07\rtda\heap\cp_interface_methodref.go 
文件 ， 在 其 中 实现 ResolvedInterfaceMethod () 方 
法 ， 代 码 如 下 : 


func (self *InterfaceMethodRef) ResolvedInterfaceMethod ( ) 
*Method { 
If self.method == nil { 
self. resolveInterfaceMethodRef() 
} 


return self.method 


} 


上 面 的 代码 和 ResolvedMethod () 方法 大 同 
小 异 ， 不 多 解释 。 下 面 来 看 resolveInterface- 
MethodRef () 方法 ， 代 码 如 下 : 


func (self *InterfaceMethodRef) resolveIinterfaceMethodRef() 


d := self.cp.class 

c := self.ResolvedClass() 

if Ic.IsInterface() { 
panic("java.lang.IncompatibleClasschangeError") 


method := lookupInterfaceMethod(c, self.name, 
self.descriptor) 
if method == nil { 
panic("java.lang.NoSuchMethodError") 


If Imethod.isAccessibleTo(d) { 
panic("java.lang.IllegalAccessError") 


} 
self.method = method 
} 


上 面 的 代码 和 resolveMethodRef () 方法 也 差 
不 多 ,但 有 两 处 差别 ,已 经 用 粗 体 显 示 。 下 面 来 
看 lookupInterfaceMethod () 函数 ， 代 码 如 下 : 


func lookupInterfaceMethod(iface *Class, name, descriptor 
string) *Method { 
for _, method := range iface.methods { 
If method.name == name && method.descriptor == 
descriptor { 
return method 


} 


return lookupMethodInInterfaces(iface.interfaces, name, 
descriptor) 


如 果 能 在 接口 中 找到 方法 ， 束 返回 找到 的 方 
法 ， 否 则 调用 lookupMethodInInterfaces () 函数 


在 超 接口 中 寻找 。lookupMethodInInterfaces () 
函数 已 经 在 前 一 小 忆 介绍。 至 此 ， 接 口 方法 符号 
引用 的 解析 也 介绍 完毕 了 ， 下 面 讨论 如 何 给 方法 
传递 参数 。 


7.3 ”方法 调用 和 参数 传 迅 


在 定位 到 需要 调用 的 方法 之 后 ，Java 虚 拟 机 
要 给 这 个 方法 创建 一 个 新 的 帧 并 把 它 推 入 Java 虚 
拟 机 栈 顶 ， 然 后 传递 参数 。 这 个 逻辑 对 于 本 章 要 
实现 的 4 条 方法 调用 指令 来 说 基本 上 相同 ， 为 了 避 
人 免 重 复 代 码 ， 在 蛙 独 的 文件 中 实现 这 个 逻 答 。 在 
ch07\instructions\base 目 录 下 创建 
method_invoke_logic.go 文 件 ， 在 其 中 实现 
InvokeMethod () 画 数 ， 代 码 如 下 : 


func InvokeMethod(invokerFrame *rtda.Frame，method 
*heap .Method ) { 
thread := InvokerFrame.Thread () 
newFrame := thread.NewFrame(method ) 
thread.PushFrame(newFrame ) 
argSlotSlot := int(method.ArgSlotCount()) 
If argSlotSlot >0{ 
for i := argSlotSlot - 1; i >= 0; i-- { 
Slot := invokerFrame.OperandStack().PopSlot() 
newFrame.LocalVars().SetSlot(uint(i), slot) 


函数 的 前 三 行 代码 创建 新 的 帧 并 推 入 Java 虚 
拟 机 栈 ， 剩 下 的 代码 传递 参数 。 重 点 讨论 参数 传 
递 。 首 先 ， 要 确定 方法 的 参数 在 局 部 变量 表 中 占 
用 多 少 位 置 。 注 意 ， 这 个 数量 并 不 一 定 等 于 从 
Java 代 码 中 看 到 的 参数 个 数 ， 原 因 有 两 个 。 第 
一 ，long 和 double 类 型 的 参数 要 占用 两 个 位 置 。 第 
二 ， 对 于 实例 方法 ，Java 编 译 器 会 在 参数 列表 的 
前 面 添 加 一 个 参数 ， 这 个 隐藏 的 参数 就 是 this 引 
用 。 假 设 实际 的 参数 占据 n 个 位 置 ， 依 次 把 这 n 个 
变量 从 调用 者 的 操作 数 栈 中 弹出 ， 放 进补 调用 方 
法 的 局 部 变量 表 中 ， 参 数 传 递 就 完成 了 。 


注意 ， 在 代码 中 ， 并 没有 对 long 和 double 类 型 
做 特别 处 理 。 因 为 探 作 的 是 Slot 结构 体 ， 所 以 这 


是 没 问题 的 。LocalVars 结 构 体 的 SetSlot () 方法 
是 新 增 的 ， 代 码 如 下 : 


func (self LocalVars) SetSlot(index uint, slot Slot) { 
self[index] = slot 


} 


如 有 果 和 忽略 long 和 double 类 型 参数 ， 则 静态 方法 
的 参数 传递 过 程 如 图 7-1 所 示 。 


Invoker Frame New Frame 
Operand Stack Local Vars 
arg3 ey 
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ee var0 


图 7-1 静态 方法 参数 传递 示意 图 


实例 方法 的 参数 传 违 过 程 如 图 7-2 所 示 


O 〇 
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图 7-2 ”实例 方法 参数 传递 示意 图 


那么 那个 ArgSlotCount () 方法 返回 了 什么 
呢 ? et 修改 


Method 结 构 体 ， 给 它 添加 argSlotCount 字 段 ， 代 人 码 
如 下 : 
type Method struct { 
ClassMember 
maxStack uint 
maxLocals uint 


code [jbyte 


argSlotCount uint 


} 


ArgSlotCount () 只 是 个 Getter 方 法 而 已 ， 代 
码 如 下 : 


func (self *Method) ArgSlotCount() uint { 
return self.argSlotCount 


} 


newMethods () 方法 也 需要 修改 ， 在 其 中 计 
算 方 法 的 argSlotCount， 代 人 码 如 下 : 


func newMethods(class *Class, cfMethods 
[]j*classfile.MemberInfo) []*Method { 
methods := make([]*Method, len(cfMethods)) 
for i, cfMethod := range cfMethods { 
methods[i] = &Method{} 
methods[i].class = class 
methods[i].copyMemberInfo(cfMethod) 
methods[i].copyAttributes(cfMethod) 
methods[i].calcArgSlotCount() 


return methods 


下 面 是 calcArgSlotCount () 方法 的 代码 。 


func (self *Method) calcArgSlotCount() { 


parsedDescriptor := 
parseMethodDescriptor(self.descriptor) 
for _, paramType := range parsedDescriptor.parameterTypes 


self.argSlotCount++ 

If paramType == "J" || paramType == "D" { 
self.argSlotCount++ 

和 


} 
If !self.IsStatic() { 


self.argSlotCount++ 
} 


parseMethodDescriptor () 画 数 分 解 方法 描述 
符 ， 返 回 一 个 MethodDescriptor 结 构 体 实例 。 这 个 
结构 体 定义 在 ch06\rtda\heap\method_descriptor.go 
文件 中 ， 代 码 如 下 : 


package heap 

type MethodDescriptor struct { 
parameterTypes [1]string 
returnType string 


} 


parseMethodDescriptor () 函数 定义 在 


chOG6\rtda\heap\method_descriptor_parser.go 文 件 


中 ， 为 了 市 约 篇 幅 ， 这 里 束 不 详细 介绍 这 个 落 数 
了 ， 感 兴趣 的 读者 请 阅读 随 书 源 代码 。 


7.4 返回 指令 


方法 执行 完毕 之 后 ， 需 要 把 结果 返回 给 调用 
方 ， 这 一 工作 由 运 回 指令 完成 。 返 回 指令 属于 控 
制 类 指令 ， 一 共有 6 条 。 其 中 return 指 令 用 于 没有 
返回 值 的 情况 ，areturn 、ireturn 、]return 、freturn 
和 dretur 分 别 用 于 返回 引用 、int、long、float 和 
double 类 型 的 值 。 在 ch07instructions/control 目 孙 
下 创建 return.go， 在 其 中 定义 返回 指令 ， 代 人 码 如 
下 


package control 

import "jvmgo/chO7/instructions/base" 

import "jvmgo/choO7/rtda" 

type RETURN struct{ base.NoOperandsInstruction } // Return 
void from method 

type ARETURN struct{ base.NoOperandsInstruction } // Return 
reference from method 

type DRETURN struct{ base.NoOperandsInstruction } // Return 
double from method 

type FRETURN struct{ base.NoOperandsInstruction } // Return 
float from method 

type IRETURN struct{ base.NoOperandsInstruction } // Return 


int from method 
type LRETURN struct{ base.NoOperandsInstruction } // Return 
long from method 


6 条 返回 指令 都 不 需要 操作 数 。return 指 令 
较 人 简单， 只 要 把 当前 帧 从 Java 虚 拟 机 栈 中 弹出 即 
可 ， 它 的 Execute () 方法 如 下 : 


func (self *RETURN) Execute(frame *rtda.Frame) { 
frame.Thread( ).PopFrame() 


其 他 5 条 返回 指令 的 Execute () 方法 都 非常 
了 下 约 篇 幅 ， 下 面 只 给 出 ireturn 指 令 的 
代码 〈《 有 差异 的 部 分 已 经 加 粗 ) : 


func (self *IRETURN) Execute(frame *rtda.Frame) { 
thread := frame.Thread() 
currentFrame := thread.PopFrame( ) 
invokerFrame := thread.TopFrame( ) 
retVal := currentFrame.OperandStack().PopInt() 
invokerFrame.OperandSstack().PushIint(retVal) 


Thread 结 构 体 的 TopFrame () 方法 和 
CurrentFrame () 代码 一 样 ， 这 里 用 不 同 的 名 称 
主要 是 为 了 避免 混淆 。 方 法 符号 引用 解析 、 参 数 
传递 、 结 果 返 回 等 都 实现 了 ， 下 面 实现 方法 调用 


巴 公 
日 令 。 


7.5 方法 调用 指令 


与 7.2 万 类似 ， 由 于 本 书 不 考虑 接口 的 静态 方 
法 和 默认 方法 ， 所 以 要 实现 的 这 4 条 指令 并 没有 元 
全 满足 Java 虚 拟 机 规 施 第 8 版 的 规定 ， 请 读者 留言 
这 一 扩 。 下 面 从 较 倍 蛙 的 invokestatic 指 令 开 始 。 


7.5.1 invokestatic 指 令 


在 ch07instructions\references 目 了 永 下 创建 
invokestatic.go 文 件 ， 在 其 中 定义 invokestatic 指 
令 ， 代 人 码 如 下 : 


package references 

import "jvmgo/chO7/instructions/base" 

import "jvmgo/chO7/rtda" 

import "jvmgo/chO7/rtda/class" 

// Invoke a class (static) method 

type INVOKE_STATIC struct{ base.Index1i6Instruction } 


结构 体 定义 比较 简单 ， 直 接 看 Execute () 方 
法 ， 代 码 如 下 : 


func (self *INVOKE_STATIC) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
methodRef := cp.GetConstant(self.Index).(*heap.MethodRef) 
resolvedMethod := methodRef .ResolvedMethod() 
If !Iresolved.IsSstatic() { 
panic("java.lang.IncompatibleClasschangeError") 
} 


base.InvokeMethod(frame, resolvedMethod) 


假定 解析 符号 引用 后 得 到 方法 M。M 必 须 是 
前 仿 方 法 ， 否 则 抛 出 Incompatible- 
ClassChangeError 异 常 。M 不 能 是 类 初始 化 方法 。 
类 初始 化 方法 只 能 由 Java 虚 拟 机 调用 ， 不 能 使 用 
invokestatic 指 令 调 用 。 这 一 规则 由 class 文 件 验 证 
器 保证 ， 这 里 不 做 检查 。 如 果 声 明 M 的 类 还 没有 
被 初始 化 ， 则 要 先 初 始 化 该 类 。 将 在 7.8 小 和 讨论 
类 的 初始 化 。 


对 于 invokestatic 指 令 ，M 束 是 最 终 要 执行 的 


方法 ， 调 用 InvokeMethod () 函数 执行 该 方法 。 


7.5.2 ”invokespecial 指 令 


invokespecial 指 令 在 第 6 革 就 定义 好 了 ， 代 码 
如 下 : 


// Invoke instance method; Special handling for superclass, 
private, 

// and instance initialization method invocations 

type INVOKE_ SPECIAL struct{ base.Index1i6Instruction } 


需要 修改 Execute () 方法 ， 代 码 稍微 有 些 复 


func (self *INVOKE_ SPECIAL) Execute(frame *rtda.Frame) { 
currentClass := frame.Method().class() 
cp := currentClass.ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodRef) 
resolvedClass := methodRef.ResolvedClass() 
resolvedMethod := methodRef .ResolvedMethod() 


移 拿 到 当前 类 、 当 前 第 量 池 、 方 法 符号 引 
用 ， 然 后 解析 符号 引用 ， 拿 到 解析 后 的 类 和 方 


法 。 继 续 看 代码 : 


if resolvedMethod.Name() == "<init>" && 
resolvedMethod.class() != resolvedClass { 
panic("java.lang.NoSuchMethodError") 


} 
if resolvedMethod.IsStatic() { 
panic("java.lang.IncompatibleClasschangeError") 


假定 从 方法 符号 引用 中 解析 出 来 的 类 是 C， 
方法 是 M。 如 末 M 是 构造 畏 数 ， 则 声明 M 的 类 必 
须 是 C， 否 则 抛 出 NoSuchMethodError 寞 钊 。 如 果 
M 是 静态 方法 ， 则 抛 出 
IncompatibleClassChangeError 寞 常 。 继 续 看 代 
位 : 


ref := 
frame.OperandSstack().GetRefFromTop(resolvedMethod.ArgSlotCou 
nt()) 
if ref == nil { 

panic("java.lang.NullPointerException") 


从 操作 数 栈 中 弹出 this 引 用 ， 如 果 该 引用 是 
null， 抛 出 NullPointerException 异 常 。 注 意 ， 在 传 
圳 参数 之 前 ， 不 能 破坏 操作 数 栈 的 状态 。 给 
OperandStack 结 构 体 添加 一 个 GetRefFromTop () 
方法 ， 该 方法 返回 距离 操作 数 栈 顶 n 个 单元 格 的 引 
用 变量 。 比 如 GetRefFromTop (0) 返回 操作 数 栈 
顶 引 用 ，GetRefFromTop (1) 返回 从 栈 顶 开始 的 
倒数 第 二 个 引用 ， 等 等 。GetRefFromTop () 方 
法 的 代码 很 容 单 ， 在 后 面 给 出 。 继 续 看 Execute 

UL 方志 


if resolvedMethod.IsProtected() && 
resolvedMethod.class().IsSuperClassof(currentClass) && 
resolvedMethod.class().GetPackageName() != 
currentClass.GetPackageName() && 
ref.Class() != currentClass && 
Iref.Class().IsSubClassOof(currentClass) { 
panic("java.lang.IllegalAccessError") 


} 


上 面 的 判断 硝 傈 protected 方 法 只 能 被 声明 该 
方法 的 类 或 子 类 调用 。 如 果 违 反 这 一 规定 ， 则 抛 
出 TllegalAccessError 寞 常 。 接 春 往 下 看 : 


methodToBeInvoked := resolvedMethod 
if currentClass.IsSuper() && 


resolvedClass.IsSuperClassof(currentClass) && 
resolvedMethod.Name() != "<init>" { 
methodToBeInvoked = 


heap.LookupMethodIinClass(currentClass.SuperClass(), 
methodRef .Name(), methodrRef .Descriptor()) 
} 


寺 面 这 段 代 码 比较 难 人 全， 把 它 翻 译 成 更 容 
理解 的 语言 : 如 采 调 用 的 中 超 类 中 的 函数 ， 但 不 
是 构造 钞 数 ， 且 当前 类 的 ACC_SUPER 标 志 人 被 设 
置 ， 需 要 一 个 额外 的 过 程 查找 最 终 要 调用 的 方 
法 ; 否则 前 面 从 方法 符号 引用 中 解析 出 来 的 方法 
驶 是 要 调用 的 方法 。 


If methodToBeInvoked == nil || 
methodToBeInvoked.IsAbstract() { 
panic("java.lang.AbstractMethodError") 


base.InvokeMethod(frame, methodtoBeInvoked) 


} 


如 末 查 找 过 程 失 败 ， 或 者 找到 的 方法 是 抽象 
的 ， 抛 出 AbstractMethodError 异 常 。 最 后 ， 如 果 
一 切 正常 ， 就 调用 方法 。 这 里 之 所 以 这 么 复杂 ， 
是 因为 调用 超 类 的 〈 非 构造 范 数 ) 方法 需要 特别 
处 理 。 限 于 篇 幅 ， 这 里 就 不 深入 讨论 了 ， 读 者 可 
以 疗 读 Java 庶 拟 机 规 疙 ， 了 人 解 类 的 ACC_SUPER 访 
问 标志 的 用 法 。 


OperandStack 结 构 体 GetRefFromTop () 方法 
的 代码 如 下 : 


func (self *OperandStack) GetRefFromTop(n uint) *heap.0bject 


return self.slots[self.size-1-n].ref 


} 


7.5.3 invokevirtual 指 令 


invokevirtual 指 令 也 已 经 在 第 6 章 定 义 好 了 ， 
代码 如 下 : 


// Invoke instance method; dispatch based on class 
type INVOKE_ VIRTUAL struct{ base.Index1i6Instruction } 


下 面 修改 Execute () 方法 ， 第 一 部 分 代码 如 
下 : 


func (self *INVOKE_ VIRTUAL) Execute(frame *rtda.Frame) { 
currentClass := frame.Method().class() 
cp := currentClass.ConstantPool() 
methodRef := cp.GetConstant(self.Index).(*heap.MethodrRef) 
resolvedMethod := methodRef.ResoJlvedMethod () 
if resolvedMethod.IsStatic() { 
panic("java.lang.IncompatibleClasscCchangeError") 


} 

ref := 
frame.OperandSstack().GetRefFromTop(resolvedMethod.ArgSlotCou 
nt() - 1) 


if ref == nil { 
// hack System.out.printlin() 
panic("java.lang.NullPointerException") 

} 

If resolvedMethod,.IsProtected() && 
resolvedMethod.class().IsSuperClassof(currentClass) && 


resolvedMethod.class().GetPpackageName() != 
currentClass.GetPackageName() && 

ref.Class() != currentClass && 

Iref .Class().IsSubCclassof(currentClass) { 

panic("java.lang.IllegalAccessError") 


这 部 分 代码 和 invokespecial 指 令 基本 上 到 不 


多 ， 也 不 多 解释 了 。 下 面 生 剩 下 的 代码 。 


methodToBeInvoked := 
heap.LookupMethodInClass(ref.Class(), 
methodRef .Name(), methodRef .Descriptor()) 
if methodToBeInvoked == nil || 
methodToBeInvoked.IsAbstract() { 
panic("java.lang.AbstractMethodError") 


base.InvokeMethod(frame, methodToBeInvoked) 


从 对 和 象 的 类 中 盘 找 真正 要 调用 的 方法 。 
找 不 到 方法 ， 或 者 找到 的 是 抽象 方法 ， 则 需 
出 AbstractMethodError 异 常 ， 否 则 一 切 正常 ， 
用 方法 。 注 意 ， 仍 然 要 用 hack 的 方式 调用 


System.out.printn () 方法 ， 代 码 如 下 : 


如 果 
要 抽 
调 


func (self *INVOKE_VIRTUAL ) Execute(frame *rtda.Frame) { 
，V// 其 他 代码 


ref := 
frame.OperandSstack().GetRefFromTop(resolvedMethod.ArgSlotCou 
nt() - 1) 
if ref == nil { 
// hack! 
If methodRef .Name() == "println™" { 


_println(frame.Operandstack(), 
methodRef .Descriptor()) 
return 


} 


panic("java.lang.NullPointerException") 


，// 其 他 代码 


_printn () 范 数 如 下 : 


func _println(stack *rtda.OperandStack, descriptor string) { 
switch descriptor { 
case "(Z)V": fmt.Printf("%v\n", stack.PopInt() != 0) 
case "(C)V": fmt.Printf("%c\n", stack.PopInt()) 
case "(B)V": fmt.Printf("%v\n", stack.PopInt()) 
case "(S)V": fmt.Printf("%v\n", stack.PopInt()) 
case "(I)V": fmt.Printf("%v\n", stack.PopInt()) 
case "(F)V": fmt.Printf("%v\n", stack.PopFloat()) 
case "(J)V": fmt.Printf("%v\n", stack.PopLong()) 
case "(D)V": fmt.Printf("%v\n", stack.PopDouble()) 
default: panic("println: " + descriptor) 


} 
stack.PopRef() 


7.5.4 invokeinterface 指 令 


在 ch07instructions\references 目 了 永 下 创建 
invokeinterface.go 文 件 ， 在 其 中 定义 
invokeinterface 指 令 ， 人 代码 如 下 : 


package references 
Import "”jvmgovcho7/instructions/Xbase” 
import "jvmgo/vcho7vrtda” 
import "jvmgo/vcho7vrtda/vheap" 
// Invoke interface method 
type INVOKE_INTERFACE struct { 
index uint 
// count uint8 
// zero uint8 


. 


注意 ， 和 其 他 三 条 方法 调用 指令 略 有 不 同 ， 
在 字 太 公 中 ，invokeinterface 指 令 的 控 作 码 后 面 跟 
着 4 字 攻 而 非 2? 字 有 。 前 两 字 世 的 合 义 和 其 他 指令 


相同 ， 是 个 uint16 运 行 时 常量 池 索 3 引 。 第 3 字 太 的 


值 是 给 方法 传递 参数 需要 的 slot 数 ， 其 合 义 和 给 
Method 结 构 体 定义 的 argSlotCount 字 段 相 同 。 正 如 
我 们 所 知 ， 这 个 数 是 可 以 根据 方法 摘 述 符 计 算出 
来 的 ， 它 的 存在 仅仅 是 因为 历史 原因 。 人 第 4 字 克 是 
留 给 Oracle 的 某 些 Java 虚 拟 机 实现 用 的 ， 它 的 值 必 
须 是 0°。 该 字 太 的 存在 是 为 了 傈 证 Java 虚 拟 机 可 以 
器 后 兼容 。 


invokeinterface 指 令 的 FetchOperands () 方法 


如 下 : 


func (self *INVOKE_INTERFACE) Fetchoperands (reader 
*base.BytecodeReader ) { 

self.index = uint(reader.ReadUint16()) 

reader .ReadUint8() // count 

reader ,ReadUint8() // must be 0 
} 


下 面 看 Execute () 方法 ， 第 一 部 分 代码 如 
下 : 


func (self *INVOKE_ INTERFACE) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
methodRef := cp.GetConstant(self.index). 
(*heap.InterfaceMethodRef ) 
resolvedMethod := methodRef.ResolvedInterfaceMethod ( ) 
if resolvedMethod.IsStatic() || 
resolvedMethod,.IsPrivate() { 
panic("java.lang.IncompatibleClasschangeError") 


} 


先 从 运行 时 常量 池 中 拿 到 并 解析 接口 方法 符 
号 引用 ， 如 有 果 人 解析 后 的 方法 是 静态 方法 或 私有 方 
则 抛 出 PmcompatibleClassChangeError 寞 种 。 


继续 看 代码 : 


ref := 
frame.OperandSstack().GetRefFromTop(resolvedMethod.ArgSlotCou 
nt() - 1) 


if ref == nil { 
panic("java.lang.NullPointerException") 


if !ref.Class().IsImplements(methodRef.ResolvedClass()) { 
panic("java.lang.IncompatibleClasschangeError") 


上 


从 操作 数 栈 中 弹出 this 引 用 ， 如 果 引 用 是 
null， 则 抛 出 NullPointerException 异 常 。 如 果 引 用 


所 指 对 象 的 类 没有 实现 解析 出 来 的 接口 ， 则 抛 出 
IncompatibleClassChangeError 寞 常 。 继 续 看 代 
位 : 


methodToBeInvoked := heap.LookupMethodInClass(ref.Class(), 
methodRef .Name(), methodRef .Descriptor()) 
if methodToBeInvoked == nil || 
methodToBeInvoked.IsAbstract() { 
panic("java.lang.AbstractMethodError") 


} 
If I!methodToBeInvoked.IsPublic() { 
panic("java.lang.IllegalAccessError") 


查找 最 终 要 调用 的 方法 。 如 末 找 不 到 ， 或 者 
找到 的 方法 是 抽象 的 ， 则 抛 出 Abstract- 
MethodError 异 遂 。 如 果 找 到 的 方法 不 是 public， 
则 抛 出 llegalAccessError 异 音 ， 否 则 ， 一 切 正 池 ， 
调用 方法 : 


base.InvokeMethod(frame, methodToBeInvoked) 


} 


至 此 ，4 条 方法 调用 指令 都 实现 完毕 了 。 再 总 
结 一 下 这 4 条 指令 的 用 途 。invokestatic 指 令 调 用 毅 
念 方法， 很 好 理解 。invokespecial 指 令 也 比较 好 理 
解 。 首 完 ， 因 为 私有 方法 和 构造 画 数 不 需要 动态 
绑 定 ， 所 以 invokespecial 指 令 可 以 加 快 方法 调用 速 
度 。 其 次 ， 使 用 super 关 键 字 调用 超 类 中 的 方法 不 
能 使 用 invokevirtual 指 令 ， 人 否则 会 陷入 无 限 循 环 。 


那么 为 什么 要 单独 定义 invokeinterface 指 令 
呢 ? 统一 使 用 invokevirtual 指 令 不 行 吗 ? 管 案 是 ， 
可 以 ,但 是 可 能 会 影响 效率 。 这 两 条 指令 的 区 别 
在 于 : 当 Java 虚 拟 机 通过 invokevirtual 调 用 方法 
肝 ，this 引 用 指向 某 个 类 (或 其 子 类 ) 的 实例 。 
为 类 的 继承 层次 是 固定 的 ， 所 以 虚拟 机 可 以 使 用 
一 种 叫 作 vtable (Virtual Method Table) 的 技术 加 


速 方 法 查找 。 但 是 当 通 过 invokeinterface 指 令 调 用 
接口 方法 时 ， 因 为 this 引 用 可 以 指向 任何 实现 了 该 
接口 的 类 的 实例 ， 所 以 无 法 使 用 vtable 技 术 。 


由 于 篇 幅 限 制 ， 这 里 就 不 深入 讨论 vtable 拉 术 
了 。 感 兴趣 的 该 者 可 以 阅读 相关 和 资料， 或 者 改进 
我 们 的 代码 ， 给 invokevirtual 指 令 增 加 vtable 优 
化 。 


4 条 方法 调用 指令 和 6 条 返回 指令 都 准备 好 
了 ， 还 需要 修改 ch07instructions\factory.go 文 件 ， 
在 其 中 增加 这 些 指令 的 case 语 句 。 鉴 于 改动 比较 
人 简单， 这 里 吏 不 给 出 代码 了 。 


7.6 ”改进 解释 硬 


我 们 的 解释 妖 目 前 只 能 执行 单个 方法 ， 现 在 
束 扩 展 它 ， 让 它 文 持 方 法 调用 。 打 开 
ch07\interpreter.go 文 件 ， 修 改 interpret () 方法 ， 
代码 如 下 : 


func interpret(method *heap.Method, logInst bool) { 
thread := rtda,NewThread () 
frame := thread.NewFrame(method ) 
thread.PushFrame(frame ) 
defer catchErr(thread) 
loop(thread, logInst) 


logInst 参 数控 制定 售 把 指令 执行 信息 打印 到 
控制 台 。 更 重要 的 变化 在 loop () 函数 中 ， 代 码 
如 下 所 示 : 


func loop(thread *rtda.Thread, logInst bool) { 
reader := &base.BytecodeReader{} 
for { 


frame := thread.CurrentFrame() 
pc := frame.NextPC() 
thread .SetPC(pc ) 
// decode 
reader ,Reset(frame,.Method(),Code()，pc) 
opcode := reader.ReadUint8() 
inst := instructions.NewInstruction(opcode) 
inst.Fetchoperands(reader ) 
frame.SetNextPC(reader .PC( ) ) 
if (logInst) { 
logInstruction(frame, inst) 
// execute 
inst.Execute(frame) 
If thread.IsStackEmpty() { 
break 
} 


在 每 次 循环 开始 ， 先 拿 到 当前 帧 ， 然 后 根据 
pc 从 当前 方法 中 解码 出 一 条 指令 。 指 令 执 行 完毕 
之 后 ， 判 断 Java 虚 拟 机 栈 中 是 否 还 有 帧 。 如 采 没 
有 则 退出 循环 ， 否 则 继续 。Thread 结 构 体 的 
IsStackEmpty () 方法 是 新 增加 的 ， 代 码 在 
ch07\rtda\thread.go 中 ， 如 下 所 示 : 


func (self *Thread) IsStackEmpty() bool { 
return self.stack.isEmpty() 
} 


它 只 是 调用 了 Stack 结 构 体 的 isEmpty () 方 
法 ， 代 码 在 ch07NtdaNvm_stack.go 中 ， 如 下 所 示 : 


func (self *Stack) isEmpty() bool { 
return self._top == nil 


} 


回 到 interpretergo， 如 采 解 释 硕 在 执行 期 间 出 
现 了 问题 ，catchErr () 函数 会 打印 出 错 信息 ， 代 
人 码 如 下 : 


func catchErr(thread *rtda.Thread) { 
if r := recover(); r != nil { 
logFrames(thread) 
panic(r) 
} 
} 


logFrames () 芳 数 打印 Java 虚 拟 机 栈 信息 ， 
代码 如 下 : 


func logFrames(thread *rtda.Thread) { 
for !thread.ISsStackEmpty() { 


frame := thread,PopFrame() 
method := frame.Method() 
className := method.Class().Name() 


fmt.Printf(">> pc:%4d %v.%v%v \n", 
frame.NextPC(), className, method.Name(), 
method.Descriptor()) 
} 
} 


logInstruction () 函数 在 方法 执行 过 程 中 打 
印 指令 信息 ， 代 码 如 下 : 


func logInstruction(frame *rtda.Frame, inst 
base.Instruction) { 

method := frame.Method() 

className := method.Class().Name() 

methodName := method.Name() 

pc := frame.Thread().PC() 

fmt.Printf("%v.%v() #%2d %T %v\n", className, methodName, 
pc, inst, inst) 


} 


解释 侨 改 造 完毕 ， 下 面 测试 方法 调用 。 


7.7 测试 方法 调用 


和 多 改造 命令 行 工 具 ， 给 它 增 加 两 个 选项 。java 
令 提 供 了 -verbose: class (简写 为 -verbose) 选 
项 ， 可 以 控制 是 否 把 类 加 载 信息 输出 到 控制 台 。 
也 增加 这 样 一 个 选项 ， 夯 外 参照 这 个 选项 增加 一 
个 -verbose: insb 项 ， 用 来 控制 是 售 把 指令 执行 
言 轧 输 出 到 控制 合 。 


E> 


打开 ch07\cmd.go 文 件 ， 修 改 Cmd 结 构 体 如 
下 : 


type Cmd Struct { 


helpFlag bool 
versionFlag bool 
verboseClassFlag bool 
verboseInstFlag bool 
cpOption string 
Xjreoption String 
class string 
args []string 


parseCmd () 函数 也 需要 修改 ， 改 动 比较 简 
单 ， 这 里 束 不 给 出 代码 了 。 下 面 修改 ch07main.go 
文件 ， 其 他 地 方 不 变 ， 只 需要 修改 startJVM () 画 
数 ， 代 码 如 下 : 


func startJVM(cmd *Cmd) { 


cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
classLoader := heap.NewClassLoader(cp, 

cmd .verboseClassFlag) 
className := strings.Replace(cmd.class, ".", "/", -1) 
mainClass := classLoader.LoadClass(className) 
mainMethod := mainClass.GetMainMethod() 


if mainMethod != nil { 
interpret(mainMethod, cmd.verboseInstFlag) 
} else { 
fmt.Printf("Main method not found in class %s\n", 
cmd.class) 
} 
} 


然后 修改 ch07\rtda\heap\class_loader.go 文 件 ， 
给 ClassLoader 结 构 体 添加 verboseFlag 字 上 段 ， 代 人 码 
如 下 : 


type ClassLoader Struct { 
cp *classpath.classpath 
verboseFlag bool 


classMap map[string]*Class 


} 


NewClassLoader () 画 数 要 相应 修改 ， 改 动 
如 下 : 


func NewClassLoader(cp *classpath.Classpath, verboseFlag 
bool) *ClassLoader { 
return &ClassLoadert{ 


cp: cp, 
verboseFlag: verboseFlag, 
classMap: make(map[string]*Class), 


} 


loadNonArrayClass () 函数 也 要 修改 ， 改 动 
如 下 : 


func (self *ClassLoader) loadNonArrayClass(name string) 


*Class { 
data, entry := self.readClass(name) 
class := self.defineClass(data) 
link(class) 


If self.verboseFlag { 
fmt.Printf("[Loaded %s from %s|\n", name, entry) 


return class 


一 切 都 准备 吏 绪 ， 打 开 命 令 行 窗 口 ， 执 行 
面 的 命令 编译 本 章 代码 : 


go install jvmgo\ch07 


命令 执行 完毕 后 ， 在 D: \govworkspace\bin 目 
采 下 出 现 ch07.exe 文 件 。 下 面 这 个 类 演示 了 各 种 情 
部 下 ，4 种 方法 调用 命令 的 使 用 。 


package jvmgo.book.cho7 ; 
public class InvokeDemo implements Runnable { 
public static void main(String[] args) { 
new InvokeDemo().test(); 


} 
public void test() { 


InvokeDemo.staticMethod(); // invokestatic 

InvokeDemo demo = new InvokeDemo( ) ; // invokespecial 

demo.instanceMethod(); // 
invokespecial 

super .equals (null); // 
invokespecial 

this.run(); // 
invokevirtual 

((Runnable) demo).run(); // 
invokeinterface 


} 
public static void staticMethod() {} 
private void instanceMethod() {} 
@Override public void run() 1{ 

} 


用 javac 编 译 InvokeDemo 类 ， 然 后 用 ch07.exe 
执行 mvokeDemo 程 序 ， 可 以 看 到 程序 正 第 执行 
(没有 任何 输出 ) ， 如 图 7-3 所 示 。 


E 命令 所 二 符 ed 口 x 


D:\go\workspace\bin>ch07. exe -Xijre ‘C:\Program Files\Java\irel. 8.0 66”jvmgo. boolG 
k. ch07. InvokeDemo 


图 7-3”InvokeDemo 执 行 结 果 


InvokeDemo 只 是 演示 ， 下 面 看 一 个 稍微 复杂 
一 些 的 例子 。 


package jvmgo.book.cho7; 
public class FibonacciTest { 
public static void main(String[] args) { 
long x = fibonacci(30); 
System.out.println(x); 
} 
private static long fibonacci(long n) { 
if (n <= 1) { return n; } 
return fibonacci(n - 1) + fibonacci(n - 2); 
} 
} 


FibonacciTest 类 演示 了 斐 波 那 兆 数列 的 计算 ， 
用 javac 编 译 它 ， 然 后 用 ch07.exe 执 行 ， 结 果 如 图 7- 
4 所 示 。 


命令 提示 符 一 器 x 
D:\go\workspace\bin>ch07. exe -Xijre ‘C:\Program Files\Java\irel.8.0 66 jrmeo. boo 
k. ch07.FibonacciTest 
832040 


图 7-4 ”FibonacciTest 执 行 结果 


几 秒 钟 集 顿 之 后 ， 控 制 台 上 打印 出 了 
832040。 我 们 的 Java 虚 拟 机 终于 可 以 执行 复杂 计算 
了 。 方 法 调用 指令 就 测试 到 这 里 ， 下 面 在 本 章 的 
最 后 ， 讨 论 类 的 初始 化 。 


7.8 ”类 初始 化 


第 6 章 实现 了 一 个 简化 版 的 类 加 载 硕 ， 可 以 把 
类 加 载 到 方法 区 中 。 但 是 因为 当时 还 没有 实现 方 
法 调用 ， 所 以 没有 办 法 初始 化 类 。 现 在 可 以 把 这 
个 逻辑 补 上 了 。 我 们 已 经 知道 ， 类 初始 化 就 是 执 
行 类 的 初始 化 方法 (<dlinit>) 。 类 的 初始 化 在 下 
列 情况 下 触发 : 


-执行 new 指 令 创 建 类 实例 ， 但 类 还 没有 侯 初 
FN 


-执行 putstatic、getstatic 指 令 存 取 类 的 静态 变 
量 ， 但 声明 该 字段 的 类 还 没有 被 初始 化 。 


执行 invokestatic 调 用 类 的 静态 方法 ， 但 声明 
该 方法 的 类 还 没有 被 初始 化 。 


当初 始 化 一 个 类 时 ， 如 果 类 的 超 类 还 没有 被 
初始 化 ， 要 先 初始 化 类 的 超 类 。 


-执行 菜 些 反射 操作 时 。 


为 了 判断 类 是 否 已 经 初始 化 ， 需 要 给 Class 结 
构 体 添加 一 个 字段 : 


type Class struct { 
,,，，// 其 他 字段 


initStarted bool 
} 


类 的 初始 化 其 实 分 为 几 个 阶段 ， 但 由 于 我 们 
的 类 加 载 右 还 不 够 完 赦 ， 所 以 先 使 用 一 个 何 早 的 
布尔 状态 就 足够 了 。initStarted 字 段 表 示 类 的 


<clinit> 方 法 是 人 否 已 经 开始 执行 。 接 下 来 给 Class 结 


构 体 添加 两 个 方法 ， 代 码 如 下 : 


func (self *Class) InitStarted() bool { 
return self.initStarted 


func (self *Class) StartInit() { 
self.initStarted = true 
} 


InitStarted () 是 Getter 方 法 ， 返 回 initStarted 
字段 值 。StartInit () 方法 把 initStarted 字 段 设 置 成 
true。 下面 修改 new 指 令 ， 代 人 码 如 下 : 


func (self *NEW) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
classRef := cp.GetConstant(self.Index).(*heap.ClassRef) 
class := classRef.ResolvedcClass() 
if !Cclass,InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


，// 其 他 代码 


putstatic 和 getstatic 指 令 改 动 类 似 ， 以 putstatic 
目 令 为 例 ， 代 码 如 下 : 


func (self *PUT_STATIC) Execute(frame *rtda.Frame) { 
，// 其 他 代码 


field := fieldRef.ResolvedField() 

class := field.Class() 

if !Cclass,InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


，// 其 他 代码 


invokestatic 指 令 也 需要 修改 ， 改 动 如 下 : 


func (self *INVOKE_ STATIC) Execute(frame *rtda.Frame) { 
，// 其 他 代码 


class := resolvedMethod.cClass() 

if !Cclass,InitStarted() { 
frame.RevertNextPC() 
base.InitClass(frame.Thread(), class) 
return 


} 


base.InvokeMethod(frame, resolvedMethod) 


4 条 指令 部 修改 完毕 了 ， 但 是 新 增加 的 代码 做 
了 些 什 么 ? 先 判断 类 的 初始 化 是 否 已 经 开始 ， 如 
果 还 没有 ， 则 需要 调用 类 的 初始 化 方法 ， 并 终止 
外 令 执 行 。 但 是 由 于 此 时 指令 已 经 执行 到 了 一 
半 ， 也 就 是 说 当前 帧 的 nextPC 字 上 段 已 经 指 癌 下 一 
条 指令 ， 所 以 需要 修改 nextPC， 让 它 重 新 指 回 当 
前 指令 。Frame 结 构 体 的 RevertNextPC () 方法 做 
了 这 样 的 操作 ， 人 代码 如 下 : 


func (self *Frame) RevertNextPC( ) { 
self.nextPC = self.thread.pc 
} 


nextPC 调 整 好 之 后 ， 下 一 步 碍 找 并 调用 类 的 
切 始 化 方法 。 这 个 逻辑 是 通用 的 ,在 
ch07\instructions\base\class_init_logic.go 文 件 中 实 
贡生 ， 代 否则 下 : 


func InitClass(thread *rtda.Thread, class *heap.Class) { 
class.StartInit() 
scheduleClinit(thread, class) 
initSuperClass(thread, class) 


InitClass () 函数 先 调 用 Startmnit () 方法 把 
类 的 initStarted 状 态 设置 成 true 以 免 进 入 死 循环 ， 
然后 调用 scheduleClinit () 函数 准备 执行 类 的 初 
化 方法 ， 代 码 如 下 : 


func scheduleClinit(thread *rtda.Thread, class *heap.Class) 


clinit := class.GetClinitMethod() 


if clinit != nil { 
// exec <clinit> 
newFrame := thread.NewFrame(clinit) 


thread.PushFrame (newFrame) 


类 初始 化 方法 没有 参数 ， 所 以 不 需要 传递 参 
数 。Class 结 构 体 的 GetClinitMethod () 方法 如 
下 : 


func (self *Class) GetClinitMethod() *Method { 
return self.getStaticMethod("<clinit>", "()V") 
} 


注意 ， 这 里 有 意 使 用 了 scheduleClinit 文 个 画 
数 名 而 非 invokeClinit， 因 为 有 可 能 要 和 完 执行 超 类 
的 初始 化 方法 ， 如 函数 initSuperClass () 所 示 。 


func initSuperClass(thread *rtda.Thread, class *heap,Class ) 


if I!class.IsInterface() { 
superClass := class.SuperClass() 
if superClass != nil && !superClass.InitStarted() { 
InitClass(thread, superClass) 
} 
} 
} 


如 琳 超 类 的 初始 化 还 没有 开始 ， 束 圳 归 调用 
InitClass () 画 数 执行 超 类 的 初始 化 方法 ， 这 样 可 
以 人 证 超 类 的 初始 化 方法 对 应 的 幅 在 于 类 上 面 ， 

使 超 类 初 她 化 方法 先 于 子 类 执行 。 


类 的 初始 化 逻辑 写 完 了 ， 由 于 篇 幅 限 制 ， 这 
里 束 不 进行 测试 了 。 读 者 可 以 参考 随 书 Java 示 例 
代码 ， 或 者 自行 编写 Java 程 序 进行 测试 。 不 过 在 
进行 测试 之 前 ， 还 需要 增加 一 个 小 小 的 hack。 由 
于 目前 还 不 文 持 本 地 方法 调用 ， 而 Java 类 库 中 的 
很 多 类 都 要 注册 本 地 方法 ， 比 如 Object 类 残 有 一 
个 registerNatives () 本 地 方法 ， 用 于 注册 其 他 方 
法 ， 代 码 如 下 : 


// java.lang.Object 
public class Object { 
private static native void registerNatives(); 
static { 
registerNatives(); 


} 
.，// 其 他 代码 


由 于 Object 类 是 其 他 所 有 类 的 超 类 ， 所 以 这 
会 叶 人 臻 Java 虚拟 机 朋 浇 。 解 决 办 法 是 修改 


InvokeMethod () 画 数 (代码 在 
chO7\instructions\base\method_invoke_logic.go 文 件 
中 ) ， 让 它 跳 过 所 有 registerNatives () 方法 ， 改 
动 如 下 : 


package base 
import "fmt" 
import "jvmgo/chO7/rtda" 
import "jvmgo/cho7/rtda/heap" 
func InvokeMethod(invokerFrame *rtda.Frame, method 
*heap.Method) { 

，// 前 面 的 代码 不 变 ， 下 面 是 


hack! 


If method.IsNative() { 
If method.Name() == "registerNatives" { 
thread.PopFrame( ) 
} else { 
panic(fmt.Sprintf("native method: %v.%v%v\n", 
method.Cclass().Name(), method.Name(), 
method.Descriptor())) 


} 
} 


如 果 遇 到 其 他 本 地 方法 ， 直 接 调 用 panic () 
函数 终止 程序 执行 即 可 。 将 在 第 9 章 讨 论 本 地 方法 


7.9 本章 小 结 


本 草 讨 论 了 方法 调用 和 返回 ， 并 且 实 现 了 类 
初始 化 逻辑 。 如 于 说 在 前 面 儿 章 里 ， 我 们 的 Java 
虚拟 机 还 是 个 小 baby 只 会 候 的 话 ， 到 了 本 草 结 
尾 ， 它 已 经 可 以 满 地 跑 了 。 下 一 章 将 讨论 数组 和 
字符 串 ， 届 时 ， 我 们 的 小 baby 束 有 更 多 的 玩具 可 
DT 


第 8 章 ”数组 和 字符 串 


在 大 部 分 编程 语言 中 ， 数 组 和 子 符 串 痢 十 最 
基本 的 数据 类 型 。Java 虚 拟 机 直接 文 持 数组 ， 对 
字符 串 的 文 持 则 由 java.lang.String 和 相关 的 类 提 
供 。 本 章 分 为 两 部 分 ， 前 半 部 分 讨论 数组 和 数组 


相关 指令 ， 后 半 部 分 讨论 字符 串 。 


在 本 章 的 讨论 中 ， 数 组 一 般 指 数组 对 象 ; 在 
不 至 于 引起 混 清 的 情况 下 ， 也 可 能 指数 组 类 ;在 
其 他 情况 下 ， 会 明确 指出 十 数组 类 还 生效 组 对 象 
。 如果 数组 的 元 取 古 基本 类 型 ， 束 把 它 叫 作 基 本 
类 型 数组 ， 否 则 ， 数 组 的 元 素 是 引用 类 型 ， 把 它 
叫 作 引用 关 型 数组 。 基 本 类 型 数组 肯定 都 是 一 维 


数组 ， 如 有 果 引 用 类 型 数组 的 元 素 也 是 数组 ， 那 么 


它 就 是 多 维 数 组 。 


开始 学 习 本 划 之 前 ， 还 十 先 把 目录 结构 准备 
好 。 复 制 ch07 目 隶 ， 改 名 为 ch08。 修 改 main.go 等 
文件 ， 把 import 语 句 中 的 ch07 全 都 蔡 换 成 ch08。 本 
革 对 目录 结构 没有 太 大 的 调整 。 


8.1 数组 概述 


效 组 在 Java 庶 拟 机 中 征 个 比较 特殊 的 概念 。 
为 什么 这 么 说 昵 ? 有 下 面 儿 个 原因 


自 完 ， 数 组 类 和 普通 的 类 是 不 同 的 。 普 通 的 
类 从 class 文 件 中 加 载 ， 但 是 数组 类 由 Java 虚 拟 机 
在 运行 时 生成 。 数 组 的 类 名 是 左 方 括号 ([) + 数 
组 元 系 的 类 型 措 述 符 ; 数组 的 类 型 挡 述 符 融 是 类 
名 本 里 。 例 如 ，int[] 的 类 名 十 [I，int[][] 的 类 名 厦 
[[I，Object[] 的 类 名 是 [Ljava/lang/Object; ， 
String[][] 的 类 名 是 [[java/lang/String; ， 等 等 。 


其 次 ， 创 建 数组 的 方式 和 创建 普通 对 象 的 方 
式 不 同 。 普 通 对 象 由 new 指 令 创 建 ， 然 后 由 构造 
国 数 初 始 化 。 基 本 类 型 数组 由 newarray 指 令 创 


建 ; 引用 类 型 数组 由 anewarray 指 令 创 建 ， 男 外 还 
有 一 个 专门 的 multianewarray 指 令 用 于 创建 多 维 数 
组 。 


最 后 ， 很 显然 ， 数 组 和 普通 对 象 存放 的 数据 
也 是 不 同 的 。 普 通 对 象 中 存放 的 是 实例 变量 ， 通 
过 putfield 和 getfield 指 令 存 取 。 数 组 对 象 中 存放 的 
则 是 数组 元 素 ， 通 过 <t>aload 和 <t>astore 系 列 指令 
按 过 引 存 取 。 其 中 <t> 可 以 是 a、b、c、d、f、i、]l 
或 者 s， 分 别 用 于 存 取 引用 、byte、char、double、 
float、int、long 或 short 类 型 的 数组 。 另 外 ， 还 有 
一 个 arraylength 指 令 ， 用 于 获取 数组 长 度 。 


Java 庶 拟 机 规范 给 了 实现 者 充分 的 目 由 来 实 
现 数 组 ， 下 面 吏 动 手 吧 ! 


8.2 ”数组 实现 


将 在 类 和 对 象 的 基础 上 实现 数组 类 和 数组 对 
象 ， 先 来 看 数组 对 象 。 


8.2.1 数组 对 象 


和 普通 对 象 一 样 ， 数 组 也 是 分 配 在 堆 中 的 ， 
通过 引用 来 使 用 。 所 以 需要 改造 Object 结 构 体 ， 
让 它 既 可 以 表示 普通 的 对 象 ， 也 可 以 表示 数组 。 
打开 ch08\rtda\heap\object.go， 修 改 Object 结 构 
体 ， 改 动 如 下 : 


type Object struct { 
class *Class 
data interfacef{} 


} 


把 fields 字 段 改 为 data， 类 型 也 从 Slots 变 成 了 
interface{}。Go 语 言 的 interface{} 类 型 很 像 C 语 言 
中 的 void*， 该 类 型 的 变量 可 以 容纳 任何 类 型 的 
值 。 对 于 普通 对 象 来 说 ，data 字 段 中 存放 的 仍然 


还 是 Slots 变 量 。 但 是 对 于 数组 ， 可 以 在 其 中 放 各 
种 类 型 的 数组 ， 详 见 下 文 。newObject () 用 来 创 
建 普 通 对 象 ， 因 此 需要 做 相应 的 调整 ， 改 动 如 
下 : 


func newObject(class *Class) *Object { 
return &Object{ 
class: class, 
data: newSlots(class.instanceSlotCount), 
} 
} 


因为 Fields () 方法 也 仍然 只 针对 普通 对 象 ， 
所 以 它 的 代码 也 需要 做 相应 调整 ， 如 下 所 示 : 


func (self *Object) Fields() Slots { 
return self.data.(Slots) 


需要 给 Object 结 构 体 添加 儿 个 数组 符 有 的 方 
法 ， 为 了 让 代码 更 加 清晰 ， 在 单独 的 文件 中 定义 


这 些 方法 。 在 ch08/rtda/heap 目 杂 下 创建 
array_object.go 文 件 ， 在 其 中 实现 8 个 方法 ， 代 码 
如 下 : 


package heap 

func (self *Object) Bytes() [lint8 { return self.data. 
([]int8) } 

func (self *Object) Shorts() []int16 { return self.data. 
([]int16) } 

func (self *Object) Ints() []int32 { return self.data. 
([]int32) } 

func (self *Object) Longs() []int64 { return self.data. 
([]int64) } 

func (self *Object) Chars() []uint16 { return self.data. 
([]uint16) } 

func (self *Object) Floats() []float32 { return self.data. 
([]float32) } 

func (self *Object) Doubles() [lfloat64 { return self.data. 
([]jfloat64) } 

func (self *Object) Refs() []*Object { return self.data. 
([]*object) } 


上 面 这 8 个 方法 分 别针 对 引用 类 型 数组 和 7 种 
基本 类 型 数组 返回 具体 的 数组 数据 。 继 续 编 辑 
array_object.go 文 件 ， 在 其 中 添加 ArrayLength () 
全 下 


func (self *Object) ArrayLength() int32 { 
Switch self.fields.(type) { 
case [1]int8: return int32(len(self.data.([]int8))) 
case []int16: return int32(len(self.data.([]int16))) 
case [jint32: return int32(len(self.data.([]int32))) 
case [1]int64: return int32(len(self.data.([]int64))) 
case [juint16: return int32(len(self.data.([]juint16))) 
case []float32: return int32(len(self.data.([]float32))) 
case []float64: return int32(len(self.data.([]float64))) 
case []*object: return int32(len(self.data.([]*Oobject))) 
default: panic("Not array!") 


读 痢 也 许 会 好 奇 ， 为 什么 返回 数组 数据 的 方 
法 有 8 个 ， 但 却 只 有 一 个 统一 的 ArrayLength () 
方法 呢 ? 答案 是 ， 这 些 方 法 主要 是 供 <t>aload、 
<t>astore 和 arraylength 指 令 使 用 的 。<t>aload 和 
<t>astore 系 列 指令 各 有 8 条 ， 所 以 针对 每 种 类 型 都 
提供 一 个 方法 ， 返 回 相 应 的 数组 数据 。 因 为 
arraylength 指 令 只 有 一 条 ， 所 以 ArrayLength () 
方法 需要 目 己 判断 数组 类 型 。 


那么 为 什么 没有 实现 Booleans () 方法 呢 ? 
因为 将 使 用 [int8 来 表示 布尔 数组 ， 所 以 只 需要 
Bytes () 方法 即 可 。 心 急 的 读者 可 以 先 跳 到 8.3 小 
三 ， 看 看 数组 相关 指令 是 如 何 实现 的 。 下 面 实现 
数组 类 。 


8.2.2 ”数组 类 


需要 修改 Class 结 构 体 ， 只 给 它 添 加 几 个 效 
组 特有 的 方法 即 可 。 为 了 强调 这 些 方法 只 针对 效 
组 类 ， 同 时 也 避免 class.go 文 件 变 得 过 长 ， 把 这 些 
方法 定义 在 新 的 文件 中 。 


在 ch08/rtda/heap 目 录 下 创建 array_class.go 文 
件 ， 在 其 中 定义 NewArray () 方法 ， 代 码 如 下 : 


func (self *Class) NewArray(count uint) *Object { 
If !self.IsArray() { 
panic("Not array class: " + self.name) 


switch self.Name() { 

case le return &Object{self, make([]int8, count)} 
case "[B": return &Object{self, make([|]int8, count)} 
case "[C": return &Object{self, make([]uint16, count)} 
case "[S": return &Object{self, make([]int16, count)} 
case "[I": return &Object{self, make([]int32, count)} 
case "[J": return &Object{self, make([]int64, count)} 
case "[F": return &Object{self, make([]float32, count)} 
case "[D": return &Object{self, make([]float64, count)} 
default: return &Object{self, make([]*Object, count)} 

} 


NewArray () 方法 专门 用 来 创建 数组 对 象 。 
如 果 类 并 不 是 数组 类 ， 就 调用 panic () 画 数 终止 
程序 执行 ， 否 则 根据 数组 类 型 创建 数组 对 象 。 注 
意 : 布尔 数组 是 使 用 字数 组 来 表示 的 。 继 续 编 
ee go， 在 其 中 定义 IsArray () 方法 ， 
代码 如 下 : 


func (self *Class) 1 bool { 
return self.name[0] == "[" 


还 会 在 array_class.go 文 件 中 实现 其 他 几 个 方 
法 ， 等 用 到 时 再 介绍 。 下 面 修改 类 加 和 载 磊 ， 让 它 
可 以 加 载 数组 类 。 


8.2.3 加载 数组 类 


打开 ch08\rtda\heap\class_loader.go 文 件 ， 修 改 
LoadClass () 方法 ， 改 动 如 下 : 


func (self *ClassLoader) LoadClass(name string) *Class { 
if class, ok := self.classMap[name]; ok { 
return class // 已 经 加 载 


if name[9] == '[" { 
return self.loadArrayClass (name) 


return self.loadNonArrayClass (name) 


+ 


这 里 增加 了 类 型 判断 ， 如 果 要 加 载 的 类 古 数 
组 类 ， 则 调用 新 的 loadArrayClass () 方法 ， 否 则 
还 按照 原来 的 逻辑 。loadArrayClass () 方法 需 

生成 一 个 Class 结 构 体 实例 ， 代 码 如 下 : 


func (self *ClassLoader) loadArrayClass(name string) *Class 


class := &Classt{ 


accessFlags: ACC_PUBLIC, // todo 

name: name, 

loader: self, 

initStarted: true, 

superClass: self.LoadcCclass("java/lang/0Object"), 
interfaces: []*Classt{ 


self.LoadClass("java/lang/Cloneable"), 
self.LoadClass("java/io/Serializable"), 


}, 


self.classMap[name] = class 
return class 


前 面 三 个 字段 的 值 比较 好 理解 ， 不 多 解释 。 
因为 数组 类 不 需要 初始 化 ， 所 以 把 initStarted 字 上 段 
设置 成 tue。 数 组 类 的 超 类 是 java.lang.Object， 并 
且 实 现 了 java.lang.Cloneable 和 java.io.Serializable 
接口 。 类 加 载 合 改造 完 人 第， 下面 来 实现 效 组 相关 


信人 3 


8.3 ”数组 相关 指令 


本 万 要 实现 20 条 指令 ， 其 中 newarray、 
anewarray、multianewarray 和 arraylength 指 令 属于 
引用 类 指令 ;， <t>aload 和 <t>astore 系 列 指令 各 有 8 
条 ， 分 别 属于 加 载 类 和 和 存储 类 指令 。 下 面 的 Java 
程序 演示 了 部 分 数组 相关 指令 的 用 处 。 


public class ArrayDemo { 
public static void main(String[] args) { 


int[] al = new int[10]; // newarray 
String[|] a2 = new String[10]; // anewarray 
int[][] a3 = new int[10][10]; // multianewarray 
int x = ali.length; // arraylength 

al[0] = 100; // iastore 

int y = a1i[0]; // iaload 

a2[0] = "abc"; // aastore 

String s = a2[0]; // aaload 


下 和 面 从 newarray 指 人 


8.3.1 newarray 指 令 


newarray 指 令 用 来 创建 基本 类 型 数组 ， 包 括 
boolean[|] 、 byte[] ~、 char[] 、 short[] ~、 int[] 、 long[]、 
float[] 和 double[]8 种 。 在 
ch08\instructions\references 目 录 下 创建 
newarray.g0， 在 其 中 定义 newarray 指 令 ， 代 码 如 
下 : 


package references 

import "jvmgo/ch08/instructions/base" 
import "jvmgo/choO8/rtda" 

import "jvmgo/cho8/rtda/heap" 

const (...) // atype 常 量 


// Create new array of primitive 
type NEW_ARRAY struct { 
atype uint8 


newarray 指 令 需 要 两 个 操作 数 。 第 一 个 操作 
数 古 一 个 uint8 整 数 ， 在 字 广 人 码 中 凤 跟 在 指令 操作 
码 后 面 ， 表 示 要 创建 哪 种 类 型 的 数组 。Java 庶 拟 
机 规 施 把 这 ea 并 且 规定 了 它 的 
有 效 值 。 把 这 些 值 定 义 为 常量 ， 代 码 如 下 : 


const ( 

AT_BOOLEAN 
AT_CHAR 
AT_FLOAT 
AT_DOUBLE 
AT_BYTE 
AT_SHORT 
AT_INT 
AT_LONG 


以 卢 oo ~ OO 人 


PO 


FetchOperands () 方法 读 取 atype 的 值 ， 代 码 
如 下 : 


func (self *NEW_ARRAY) FetchOperands(reader 
*base.BytecodeReader) { 

self.atype = reader .ReadUint8() 
} 


newarray 指 令 的 第 二 个 操作 数 是 count， 从 操 
作 数 栈 中 弹出 ， 表 示 数 组 长 度 。Execute () 方法 
根据 atype 和 count 创 建 基 本 类 型 数组 ， 代 码 如 下 : 


func (self *NEW_ARRAY) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
count := stack.PopInt() 
if count < 0 ff 
panic("java.lang.NegativeArraySizeException") 


classLoader := frame.Method().Cclass().Loader() 
arrClass := getPrimitiveArrayClass(classLoader, 
self .atype) 
arr := arrClass.NewArray(uint(count)) 
stack.PushRef (arr) 
} 


如 采 count 小 于 0， 则 抛 出 
NegativeArraySizeException 异 常 ， pie 
值 使 用 当前 类 的 类 加 载 絮 加 载 数 组 类 ， 然 后 创建 
数组 对 象 并 推 入 探 作 数 栈 。getPrimitiveArrayClass 

WU 画 数 的 代码 如 下 : 


func getPprimitiveArrayClass(loader *heap.ClassLoader, atype 
uint8) *heap.Class { 


Switch atype { 


case AT_BOOLEAN : return loader.LoadClass("[Z") 
case AT_BYTE: return loader.LoadClass("[B") 
case AT_CHAR: return loader.LoadClass("[C") 
case AT_SHORT : return loader.LoadClass("[S") 
case AT_INT: return loader.LoadClass("[I") 
case AT_LONG: return loader.LoadClass("[J") 
case AT_FLOAT: return loader.LoadClass("[F") 
case AT_DOUBLE: return loader.LoadClass("[D") 
default: panic("Invalid atype!") 

} 


下 面 实现 anewarray 指 令 。 


8.3.2 anewarray 指 令 


anewarray 指 令 用 来 创建 引用 类 型 数组 。 在 
ch08\instructionsreferences 目 录 下 创建 
anewarray.go 文 件 ， 在 其 中 定义 anewarray 指 令 ， 代 
码 如 下 : 


package references 

import "jvmgo/vcho08/instructions/Xbase” 

Import "jvmgo/cho8/rtda" 

Import "jvmgo/cho8/rtda/heap" 

// Create new array of reference 

type ANEW_ARRAY struct{ base.Index1i6Instruction } 


anewarray 指 令 也 需要 两 个 操作 数 。 第 一 个 操 
作 数 古 uint16 有 索引 ， 米 日 字 术 人 码 。 通 过 这 个 索引 可 
以 从 当前 类 的 运行 时 常量 池 中 找到 一 个 类 符号 引 
用 ， 解 析 这 个 符号 引用 束 可 以 得 到 数组 元 系 的 
类 。 第 二 个 操作 数 是 数组 长 度 ， 从 操作 数 栈 中 弹 


出 。Execute () 方法 根据 数组 元 素 的 类 型 和 数组 
长 度 创 建 引用 类 型 数组 ， 代 码 如 下 : 


func (self *ANEW_ ARRAY) Execute(frame *rtda.Frame) { 
cp := frame.Method(),Class().ConstantPool( ) 
classRef := cp.GetConstant(self.Index).(*rtc.ClassRef) 
componentClass := classRef.ResolvedClass() 
stack := frame.OperandStack() 
count := stack.PopInt() 
If count < 0 ff 
panic("java.lang.NegativeArraySizeException") 


arrClass := componentClass.ArrayClass() 


arr := arrClass.NewArray(uint(count)) 
stack.PushRef (arr) 


上 面 的 代码 比较 容易 理解 ， 这 里 整 不 详细 人 解 
释 了 “。Class 结 构 体 的 ArrayClass () 方法 返回 与 
类 对 应 的 数组 类 ， 代 码 在 class.go 文 件 中 ， 如 下 所 


一 一 


休 、\: 


func (self *Class) ArrayClass() *Class { 
arrayClassName := getArrayClassName(self.name) 
return self.loader.LoadClass(arrayClassName) 


; 


完 根 据 类 名 得 到 数组 类 名 ， 然 后 调用 类 加 载 
器 加 载 数 组 类 即 可 。 在 ch08\rtda\heap 目 录 下 创建 
class_name_helper.go 文 件 ， 在 其 中 实现 
getArrayClassName () 范 数 ， 代 码 如 下 : 


package heap 
func getArrayClassName(className string) string { 
return "[" + toDescriptor(className) 


把 类 名 转变 成 类 型 摘 述 符 ， 然 后 在 前 面 加 上 
方 括 号 即 可 。 在 class_name_helper.go 文 件 中 实现 
toDescriptor () 画 数 ， 代 码 如 下 : 


func toDescriptor(className string) String { 
if className[0] == '[" { 
return className 


if d, ok := primitiveTypes[className]; ok { 
return d 


return "L" + className + ";" 


如 朱 是 效 组 类 名 ， 挡 述 符 驶 是 类 和 名， 下 接 返 
回 即 可 。 如 果 是 基本 类 型 名 ， 返 回 对 应 的 类 型 描 
述 符 ， 人 否则 肯定 是 普通 时 类 名 ， 前 面 加 上 方 括 
号 ， 绪 尾 加 上 分 号 即 可 得 到 类 型 搞 述 人 符 。 
primitiveTypes 变 量 也 在 class_name_helper.go 文 件 
中 定义 ， 代 码 如 下 : 


var primitiveTypes = map[string]stringt{ 


"void": V 

"boolean": "ZZ 
"byte": Be 
"short": “Sr 

和 和 A 
"long": A ee 
"char": 人 
"float"™: "FE", 
"double": "D", 


除了 newarray 和 anewarray， 还 有 一 个 
multianewarray 指 令 ， 专 | ] 用 来 创建 多 维 数 组 。 这 


个 指令 比较 复杂 ， 帮 到 最 后 实现 。 下 面 来 看 


arraylength 指 令 。 


8.3.3 arraylength 指 令 


arraylength 指 令 用 于 获取 数组 长 度 。 在 
ch08\instructions\eferences 目 了 永 下 创建 
arraylength.go， 在 其 中 定义 arraylength 指 令 ， 代 三 
如 下 : 


package references 

Import "jvmgo/ch08/instructions/base" 

Import "jvmgo/vcho08vrtda” 

// Get length of array 

type ARRAY_LENGTH struct{ base.NoOperandsInstruction } 


arraylength 指 令 只 需要 一 个 操作 数 ， 即 从 操作 
数 栈 顶 弹 出 的 数组 引用 。Execute () 方法 把 数组 
长 度 推 入 操作 数 栈 顶 ， 代 但 如 下 : 


func (self *ARRAY_LENGTH) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
arrRef := stack.PopRef() 
if arrRef == nil { 
panic("java.lang.NullPointerException") 


} 
arrLen := arrRef .ArrayLength() 
stack.PushIint(arrLen) 


} 


如 果 数 组 引用 是 null， 则 需要 抛 出 
NullPointerException 异 锅 ， 人 否则 取 数 组 长 度 ， 推 
入 操作 数 栈 顶 即 可 。 下 面 实现 <t>aload 和 <t>astore 
系列 指令 “ 


8.3.4 ”<t>aload 指 令 


<t>aload 系 列 指令 按 索 引 取 数组 元 又 值 ， 然 
后 推 入 操作 数 栈 。 在 ch08\instructions\loads 目 录 下 


创建 xaload.go 文 件 ， 在 其 中 定义 8 条 指令 ， 


下 : 


package loads 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 


type 
type 
type 
type 
type 
type 
type 
type 


AALOAD 
BALOAD 
CALOAD 
DALOAD 
FALOAD 
IALOAD 
LALOAD 
SALOAD 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 
base. 
base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


AAA 


代码 如 


这 8 条 指令 的 实现 大 同 小 异 ， 为 了 节约 篇 幅 ， 
以 aaload 指 令 为 例 进 行 说 明 。 其 Execute () 方法 


如 下 : 


func (self *AALOAD) Execute(frame *rtda.Frame) { 
stack := frame.OperandStack() 
index := stack.PopInt() 
arrRef := stack.PopRef() 
checkNotNil(arrRef) 
refs := arrRef .Refs() 
checkIndex(len(refs), index) 
stack.PushRef(refs[index]) 


目 完 从 操作 数 栈 中 弹出 第 一 个 操作 数 ， 数组 
索引 ， 然 后 弹出 第 二 个 操作 数 : 数组 引用 。 如 末 
数组 引用 是 null， 则 抛 出 NullPointerException 异 
常 。 这 个 判断 在 checkNotNil () 了 画 数 中 ， 代 码 如 
下 : 


func checkNotNil(ref *heap.0bject) { 
if ref == nil { 
panic("java.lang.NullPointerException") 


如 有 朱 效 组 条 引 小 于 0， 或 痢 大 于 等 于 数组 长 
度 ， 则 抛 出 ArrayIndexOutOfBoundsException。 这 


个 检查 在 checkIndex () 芳 数 中 ， 代 码 如 下 : 


func checkIndex(arrLen int, index int32) { 
if index < 0 || index >= int32(arrLen) { 
panic("ArrayIndexOutOofBoundsException") 


如 来 一 切 正 第 ， 则 按 索 引 取 出 数组 元 系 ， 推 
入 控 作 数 栈 项 。 


8.3.5 “<t>astore 指 令 


<t>astore 系 列 指令 按 索引 给 数组 元 素 央 全 。 
在 ch08\instructions\stores 目 如下 创建 xastore.go 文 
件 ， 在 其 中 定义 8 条 指令 ， 代 码 如 下 : 


package stores 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 


type 
type 
type 
type 
type 
type 
type 
type 


这 8 条 指令 的 实现 站 大 同 小 异 ， 以 iastore 为 例 


AASTORE 
BASTORE 
CASTORE 
DASTORE 
FASTORE 
IASTORE 
LASTORE 
SASTORE 


structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 
structt{ 


base. 
base. 
base. 
base. 
base. 
base. 
base. 
base. 


NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 
NoOperandsInstruction 


进行 说 明 ， 其 Execute () 方法 如 下 : 


ccc 


func (self *IASTORE) Execute(frame *rtda.Frame) { 


stack := frame.OperandStack() 
val := stack.PopInt() 
index := stack.PopInt() 


arrRef := stack.PopRef() 
checkNotNil(arrRef) 

ints := arrRef.Ints() 
checkIndex(len(ints), index) 
ints[index] = int32(val) 


iastore 指 令 的 三 个 操作 数 分 别 是 ， 要 赋 给 数 
组 元 素 的 值 、 数 组 索引 、 数 组 引用 ， 依 次 从 操作 
数 栈 中 弹出 。 如 果 数 组 引用 是 null， 则 抛 出 
NullPointerException。 如果 数组 索引 小 于 0 或 者 大 
于 等 于 数组 长 度 ， 则 抛 出 
ArrayIndexOutOfBoundsException 异 常 。 这 两 个 检 
查 和 <t>aload 系 列 指 令 一 样 。 如 果 一 切 正常 ， 则 
按 索引 给 数组 元 素 赋值 。 


<t>aload 和 <t>astore 指 令 实 现 好 了 ， 下 面 来 看 


multianewarray 指 令 。 


8.3.6_ multianewarray 指 令 


multianewarray 指 令 创建 多 维 数组 。 在 
ch08\instructions\references 目 杂 下 创建 
multianewarray.go 文 件 ， 在 其 中 定义 
multianewarray 指 令 ， 代 码 如 下 所 示 : 


package references 
import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 
import "jvmgo/cho8/rtda/heap" 
// Create new multidimensional array 
type MULTI_ANEW_ARRAY struct { 

index uint16 

dimensions uint8 


} 


multianewarray 指 令 的 第 一 个 操作 数 是 个 
uint16 索 引 ， 通 过 这 个 索引 可 以 从 运行 时 常量 池 中 
找到 一 个 类 符号 引用 ， 解 析 这 个 引用 或 可 以 得 到 
多 维 数组 类 。 人 第 二 个 操作 数 是 个 uint8 整 效 ， 表 示 


数组 维度 。 这 两 个 操作 数 在 学 太公 中 紧 跟 在 指令 
操作 码 后 面 ， 由 FetchOperands () 方法 读 取 ， 代 
们 如 下 : 


func (self *MULTI_ANEW_ARRAY) Fetchoperands (reader 
*base.BytecodeReader ) { 
self.index = reader.ReadUint16() 
self.dimensions = reader.ReadUint8() 


} 


multianewarray 指 令 还 需要 从 操作 数 栈 中 弹出 
n 个 整数 ， 分 别 代表 每 一 个 维度 的 数组 长 度 。 
Execute () 方法 根据 数组 类 、 数 组 维度 和 各 个 维 
度 的 数组 长 度 创 建 多 维 数组 ， 代 码 如 下 : 


func (self *MULTI_ANEW ARRAY) Execute(frame *rtda,Frame) { 
cp := frame.Method().cCclass().ConstantPool() 
classRef := cp.GetConstant(uint(self.index)). 
(*heap.ClassRef) 
arrClass := classRef.ResolvedClass() 
stack := frame.OperandStack() 
counts := popAndCheckCounts(stack, int(self.dimensions)) 
arr := NnewMultiDimensionalArray(counts, arrClass) 
stack.PushRef (arr) 


这 里 提醒 读者 注意 ， 在 anewarray 指 令 中 ， 解 
析 类 符号 引用 后 得 到 的 是 数组 元 取 的 类 ， 而 这 
解析 出 来 的 直接 束 是 数组 类 。 
popAndCheckCounts () 函数 从 操作 数 栈 中 弹出 n 
个 int 值 ， 并 且 确 傈 它们 都 大 于 等 于 0。 如 朱 其 中 任 
何 一 个 小 于 0， 则 抛 出 NegativeArraySizeException 
寞 第。 代码 如 下 : 


func popAndcheckCounts(stack *rtda,OperandStack，dimensions 
int) []int32 { 
counts := make([]int32, dimensions) 
for i := dimensions - 1; i >= 0; i-- { 
counts[i] = stack. popInt() 
If counts[i] <0{ 
panic("java.lang.NegativeArraySizeException") 


return counts 


} 


newMultiArray () 函数 创建 多 维 数组 ， 代 码 
如 下 : 


func newMultiDimensionalArray(counts [|]int32, arrClass 
*heap.Class) *heap.Object { 
count := uint(counts[0]) 
arr := arrClass.NewArray(count) 
If len(counts) >11{ 
refs := arr.Refs() 
for i := range refs { 
refs[i] = newMultiDimensionalArray (counts[1:], 
arrClass.ComponentClass()) 


} 


return arr 


} 


Class 结 构 体 的 ComponentClass () 方法 返回 
数组 类 的 元 宁 类 型 在 array_class.go 文 件 中 ， 代 码 
如 下 : 


func (self *Class) ComponentClass() *Class { 
componentClassName := getComponentClassName(self.name) 
return self.loader.LoadClass(componentClassName) 


} 


ComponentClass () 方法 先 根据 数组 类 名 推 
测 出 数组 元 又 类 名 ， 然 后 用 类 加 载 磊 加 载 元 又 类 
妈 可 。getComponentClassName () 函 数 在 


ch08\rtda\heap\class_name_helper.go 文 件 中 ， 代 码 
如 下 : 


func getComponentClassName(className string) string { 
if className[0] == '[" { 
componentTypeDescriptor := className[1:] 
return toClassName(componentTypeDescriptor) 


panic("Not array: " + classNanme) 


数组 类 名 以 方 括号 开头 ， 把 它 去 掉 就 是 数组 
元 素 的 类 型 描述 符 ， 然 后 把 类 型 描述 符 转 成 类 名 
即 可 。toClassName () 画 数 也 在 
class_name_helper.go 文 件 中 ， 代 码 如 下 : 


func toClassName(descriptor string) string { 
if descriptor[0] == '[ { // array 
return descriptor 


} 
if descriptor[0] == 'L' { // object 
return descriptor[1 : len(descriptor)-1] 


for className, d := range primitiveTypes { 
if d == descriptor { // primitive 
return className 


panic("Invalid descriptor: " + descriptor ) 


如 东 拓 型 摘 述 符 以 方 括号 开头 ， 那 么 肯定 是 
数组 ， 插 述 符 即 是 类 名 。 如 末 类 型 插 述 符 以 L 开 
头 ， 那 么 肯定 是 关 描述 符 ， 去 挥 开头 的 L 和 末尾 
的 分 号 即 是 类 名 ， 否 则 判断 是 否 是 基本 类 型 的 摘 
述 从 ， 如 末 是 ， 返 回 基 本 类 型 名 称 ， 否 则 调用 
panic () 函数 终止 程序 执行 。 


至 此 ，maultianewarray 终 于 解释 完了 。 由 于 该 
日 令 比 较 难 理解 ， 用 一 个 例子 分 析 。 


public void test() { 
int[][][] x = newint[3j[4][5]; 


上 而 的 Java 方 法 创建 了 一 个 三 维 数 组 ， 编 详 
之 后 的 子玉 人 码 如 下 : 


00 iconst_3 

01 Iconst_4 

02 Iconst_5 

03 multianewarray #5 // [[[I, 3 
07 astore 1 

08 return 


编译 器 先生 成 了 三 条 iconst_n 指 令 ， 然 后 又 生 
成 了 一 条 multianewarray 指 令 ， 和 狮 下 的 两 条 指令 和 
数组 创建 无 关 。multianewarray 指 令 的 第 一 个 操作 
效 征 5， 定 个 类 引用 ， 类 名 征 [[II， 说 明 要 创建 的 
尽 int[][][] 数 组 。 第 二 个 操作 数 是 3， 说 明 要 创建 二 
维 数 组 。 


当 方 法 执行 时 ， 三 条 iconst_n 指 令 先 后 把 整数 
3、4、5 推 入 操作 数 栈 顶 。mnultianewarray 指 令 在 
解码 时 就 已 经 拿 到 常量 池 索 引 (5) 和 数组 维度 

(3) 。 在 执行 时 ， 它 先 查 找 运行 时 常量 池 索 引 ， 
知道 要 创建 鸭 是 intDUDD 数 组 ， 接 痢 从 操作 数 栈 中 
弹出 三 个 int 值 ， 依 次 是 5、4、3。 现在 


multianewarray 指 令 拿 到 了 全 部 信息 ， 从 最 外 维 开 


始 创建 效 组 实例 即 可 。 


专门 用 于 数组 的 指令 实现 好 了 ， 但 别 忘 了 还 
需要 修改 ch08\instructions\factory.go 文 件 ， 在 其 中 
添加 这 些 指 令 的 case 语 句 。 改 动 比较 简单 ， 这 里 
束 不 给 出 代码 了 。 下 面 修改 instanceof 和 
checkcast， 让 这 两 条 指令 可 以 正确 用 于 数组 对 
象 o 


8.3.7“ 完 善 instanceof 和 checkcast 指 令 


虽然 说 是 完善 instanceof 和 checkcast 指 令 ， 但 
实际 上 这 两 条 指令 的 代码 都 没有 任何 变化 。 需 
修改 的 是 ch08\rtda\heap\class_hierarchy.go 文 件 中 
的 isAssignableFrom () 方法 ， 而 且 改 动 很 大 ， 代 
码 如 下 : 


func (self *Class) isAssignableFrom(other *Class) bool { 
s, t := other, self 
if s == tH{ 
return true 


} 
If !S.ISArray() { 
if !S.ISInterface() { 
if It.ISInterface() { 
return s.IsSubclassof(t) 
} else { 
return s.IsImplements(t) 


} 
} else { 
if !t.ISInterface() { 
return t.isJl0Object() 
} else { 
return t.isSuperIinterfaceof(s) 


} 


} 
} else { 
If It.ISArray() { 


if It.ISInterface() { 
return t.isJl0Object() 
} else { 
return t.isJlCloneable() || 
t.isJioSerializable() 
} else { 
= s.ComponentClass() 
= t.ComponentClass() 
return sc == tc || tc.isAssignableFrom(sc) 


} 


return false 


有 


注意 ， 粗 体 部 分 是 原来 的 代码 ， 其 余 都 是 新 
增 代码 。 由 于 扁 幅 限制 ， 吏 不 详细 解释 这 个 函 效 
了 ， 请 读者 阅读 Java 虚 拟 机 规范 的 8.6.5 太 对 
instanceof 和 checkcast 指 令 的 描述 。 需 要 注意 的 


日 
AE: 


.数组 可 以 强制 转换 成 Object 类 型 (因为 数组 
的 超 类 是 Object) 。 


数组 可 以 强制 转换 成 Cloneable 和 Serializable 
类 型 (因为 数组 实现 了 这 两 个 接口 ) 。 


如果 下 面 两 个 条 件 之 一 成 立 ， 类 型 为 [SC 的 
数组 可 以 强制 转换 成 类 型 为 TC 的 数组 : 


:TC 和 SC 是 同一 个 基本 类 型 。 


TC 和 SC 都 是 引用 类 型 ， 且 SC 可 以 强制 转 
换 成 TC。 


8.4 测试 数组 


数组 相关 的 内 容 短 不 多 部 准备 好 了， 下 面 用 
经 典 的 冒 泡 排序 算法 测 话 。 


package jvmgo.book.ch0o8; 
public class BubbleSortTest { 
public static void main(String[] args) { 
int[] arr = {22, 84, 77, 11, 95, 9, 78, 56, 36, 97, 
65, 36, 10, 24 ,92, 48}; 
bubbleSort(arr); 
printArray(arr); 
} 
private static void bubbleSort(int[] arr) { 
boolean swapped = true; 
int j = 0; 
int tmp; 
while (swapped) { 
swapped = false; 
j++; 
for (int i = 0; i < arr.length - J; i++) { 
If (arr[i] > arr[i + 1]) { 
tmp = arr[il]; 
arr[i] = arr[i + 1]; 
arr[i + 1] = tmp; 
swapped = true; 


} 
} 
private static void printArray(int[] arr) { 
for (int i : arr) { 
System.out.println(i); 
} 


打开 命令 行 袖口， 执行 下 面 的 命令 编译 本 章 
代码 : 


go install jvmgoxch08 


命令 执行 完毕 后 ， 在 D: \go\Wwworkspace\bin 日 
了 永 下 出 现 ch08.exe 文 件 。 用 javac 编 译 ， 然 后 用 
ch08.exe 执 行 BubbleSortTest 类 ， 结 果 如 图 8-1 所 


小 ° 


k. ch08. BubbleSortTest 
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图 8-1 ”BubbleSortTest 程 序 执行 结 


8.5 ”字符 品 


在 class 文 件 中 ， 字 人 符 串 是 以 MUTF8 格 式 傈 存 
的 ， 这 一 点 在 3.3.7 世 讨论 过 。 在 Java 虚 拟 机 运行 
期 间 ， ed (后 面 简称 
String) 对 象 的 形式 存在 ， 而 在 String 对 象 内 部 ， 
字符 串 义 是 以 UTF16 格 式 你 存 的 。 字 从 串 相 天 功 
能 大 部 分 都 是 由 String 《和 StringBuilder 等 ) 类 提 
供 的 ， 本 市 只 实现 一 些 辅助 功能 即 可 。 


String 类 有 两 个 实例 变量 。 共 中 一 个 走 
value， 类 型 是 字符 数组 ， 用 于 存放 UTF16 编 码 后 
的 字符 序列 。 另 一 个 是 hash， 绥 人 存 计 字符 串 的 哈 
布 僻 ， 人 代码 如 下 : 


package java.1lang; 
public final class String 

implements java.io.Serializable, Comparable<String>, 
CcharSequence { 

/** The value is used for character storage. */ 

private final char valuel[|]; 

/** Cache the hash code for the string */ 

private int hash; // Default to 0 

，// 其 他 代码 


字符 串 对 象 是 不 可 变 (immutable) 的 ， 
构造 好 之 后 ， 就 无 法 再 改变 其 状态 (这 里 指 value 
字段 ) 。String 类 有 很 多 构造 函数 ， 其 中 一 个 是 根 
据 字符 数组 来 创建 String 实 例 ， 代 码 如 下 : 


public String(char value[]) { 
this.value = Arrays.copyof(value, value.1length); 


3 


本 世 将 参考 上 面 的 构造 画 数 ， 和 直接 创建 String 
实例 。 为 了 下 约 内 存 ，Java 虚 拟 机 内 部 维护 了 一 


个 字符 串 池 。String 类 提供 了 intem () 实例 方 
法 ， 可 以 把 目 己 放 入 字符 串 池 。 代 码 如 下 : 


public native String intern(); 


本 市 将 实现 字符 串 池 ， 由 于 intern () 是 本 地 
方法 ， 所 以 留 到 第 9 章 实 现 。 


8.5.1 字符 串 池 


在 ch08\rtda\heap 目 录 下 创建 string_pool.go 文 
件 ， 在 其 中 定义 internedStrings 变 量 ， 代 码 如 下 : 


package heap 
import "unicode/utf16" 
var internedStrings = map[string]*Object{} 


用 map 来 表示 字符 串 池 ，key 是 Go 字符 上 串 ， 
value 是 Java 字 符 串 。 继 续 编辑 string_pool.go 文 
件 ， 在 其 中 实现 JString () 函数 ， 代 码 如 下 : 


func JString(loader *ClassLoader, goStr string) *Object { 

if internedSstr, ok := internedSstrings[goStr]; ok { 
return InternedStr 

} 
chars := stringToUtf16(goSstr) 
jChars := &Object{loader.LoadClass("[C"), chars} 
jJStr := loader.LoadClass("java/lang/String").NewObject() 
JjStr.SetRefVar("value", "[C", jChars) 
InternedStrings[goStr] = jStr 
return jsStr 


JString () 画 数 根据 Go 字符 串 返 回 相应 的 
Java 字 符 串 实例 。 如 果 Java 字 符 串 已 经 在 池 中 ,， 直 
接 返 回 即 可 ， 否 则 先 把 Go 字符 串 (UTF8 格 式 ) 
转换 成 Java 字 符 数 组 (UTF16 格 式 ) ， 然 后 创建 
一 个 Java 字 符 串 实例 ， 把 它 的 value 变 量 设置 成 刚 
刚 转 换 而 来 的 字符 数组 ， 最 后 把 Java 字 符 串 放 入 
池 中 。 注 意 ， 这 里 其 实 是 跳 过 了 String 的 构造 画 
数 ， 直 接 用 hack 的 方式 创建 实例 。 在 前 面 分 析 过 
String 类 的 代码 ， 这 样 做 虽然 有 点 投机 取 巧 ， 但 确 
实 是 没有 问题 的 。 


继续 编辑 string_pool.go 文 件 文 件 ， 实 现 
stringToUtf16 () 函数 ， 代 人 码 如 下 : 


func stringToUtf16(s string) []uint16 { 
runes := [J]rune(s) // utf32 
return utf16.Encode(runes) 


} 


Go 语言 字符 串 在 内 存 中 是 UTF8 编 码 的 ， 先 

把 它 强制 转 成 UTF32， 然 后 调用 utf16 包 的 Encode 
() 画 数 编码 成 UTF16。Object 结 构 体 的 

SetRefVar () 方法 直接 给 对 象 的 引用 类 型 实例 变 
量 赋值 ， 代 码 如 下 (在 object.go 文 件 中 ) : 


func (self *Object) SetRefVar(name, descriptor string, ref 
*Object) { 
field := self.class.getField(name, descriptor, false) 
slots := self.data.(Slots) 
slots.SetRef(field.slotIid, ref) 
} 


Class 结 构 体 的 getField () 函数 根据 字段 名 和 
摘 述 符 查 找 字 段 ， 代 码 如 下 (代码 在 dlass.go 文 件 
) 


让 


func (self *Class) getField(name, descriptor string, 
isStatic) *Field { 
for c := self; c != nil; c = c.superClass { 
for _, field := range c.fields { 
If field.IsStatic() == isStatic && 
field.name == name && field.descriptor == 
descriptor { 
return field 


} 


return nil 


} 


字符 串 池 实现 好 了 了， 下面 修改 idc 指 令 和 类 加 
载 器 ， 让 它们 支持 字符 串 。 


8.5.2 ”完善 dc 指令 


打开 ch08\instructions\constants\ldc.go 文 件 ， 
添加 一 条 import 语 铝 ， 代 但 如 下 : 


package constants 

import "jvmgo/ch08/instructions/base" 
import "jvmgo/cho8/rtda" 

import "jvmgo/cho8/rtda/heap" 


然后 修改 _ldc () 图 数 ， 改 动 如 下 : 


func _ldc(frame *rtda.Frame, index uint) { 


stack := frame.OperandStack() 
class := frame.Method().Cclass() 
c := class.ConstantPool().GetConstant(index) 


Switch c.(type) { 
case int32: stack.PushIint(c.(int32)) 
case float32: stack.PushFloat(c. (float32)) 
case string: 
internedStr := heap.JString(class.Loader(), c. 
(string)) 
stack.PushRef(internedStr ) 
，// 其 他 代码 不 变 


如 东 1dc 弃 独 从 运行 时 音量 池 中 加 载 字符 果 音 
量 ， 则 先 通过 常量 拿 到 Go 字符 串 ， 然 后 把 它 转 成 
Java 字 符 昌 实例 并 把 引用 扒 入 操作 数 栈 项 。 


8.5.3 ”完善 关 加 载 厦 


打开 ch08\rtda\heap\class_loader.go 文 件 ， 修 改 
initStaticFinalVar 函 数 ， 改 动 如 下 : 


func initStaticFinalVar(class *Class, field *Field) { 

vars := class.staticVars 

cp := class.constantPool 

cpIndex := field.ConstValueIindex() 

slotId := field.SlotId() 

If cpIndex > 0 { 

Switch field.Descriptor() { 
，V// 其 他 


case 语 句 不 变 


case "Ljava/lang/String;": 
goStr := cp.GetConstant(cpIndex).(string) 
jStr := JString(class.Loader(), goSstr) 
vars.SetRef(slotId, jsStr) 
} 
} 
} 


这 里 增加 了 字符 串 类 型 静态 季 量 的 初始 化 有 
辑 ， 人 代码 比较 商 单 ， 吏 不 多 解释 了 。 至 此 ， 了 字符 


串 相 关 的 工作 部 做 完了 ， 下 面 进 行 测 试 。 


8.6 测试 字符 串 


打开 ch08\main.go 文 件 ， 修 改 starUJVM () 画 
数 。 改 动 非常 小 ， 只 是 在 调用 interpret () 画 数 
时， 把 传递 给 Java 主 方法 的 参数 传递 给 它 ， 代 人 码 如 
下 : 


func startJVM(cmd *Cmd) { 
，// 其 他 代码 不 变 


if mainMethod != nil { 
interpret(mainMethod, cmd.verboseInstFlag, cmd.args) 
} else { 
fmt.Printf("Main method not found in class %s\n", 
cmd.class) 


} 


打开 interpreter.go 文 件 ， 修 改 interpret () 画 
数 ， 改 动 如 下 : 


func interpret(method *heap.Method, logInst bool, args 
[]string) { 


thread := rtda.NewThread ( ) 

frame := thread.NewFrame(method ) 
thread.PushFrame(frame ) 

JArgs := createArgSsArray(method.Class().Loader()，args ) 
frame.LocalVars().SetrRef(0, jArgs) 

defer catchErr(thread) 

loop(thread, logInst) 


interpret () 汞 数 授 收 从 startJVM () 函数 中 
传递 过 来 的 args 参 数 ， 人 然后 调用 createArgs-Array 
() 画 数 把 它 转 换 成 Java 字 符 串 数组 ， 最 后 把 这 个 
数组 推 入 操作 数 栈 项 。 至 此 ， 通 过 命令 行 传递 给 
Java 程 序 的 参数 终于 可 以 派 上 用 场 了 | 
createArgsArray () 国 数 的 代码 如 下 : 


func createArgsArray(loader *heap.ClassLoader, args []string) 
*heap.Object { 

stringClass := loader.LoadClass("java/lang/String") 

argsArr := 
stringClass .ArrayClass().NewArray(uint(1len(args))) 

JArgs := argsArr.Refs() 

for i, arg := range args { 

JArgs[i] = heap.JString(loader, arg) 


return argsArr 


最 后 ， 打 开 
ch08\instructions\references\invokevirtual.go， 修 改 
_println () 汞 数 ， 让 它 可 以 打印 字符 串 ， 改 动 如 
下 : 


// hack! 
func _println(stack *rtda.OperandSstack, descriptor string) { 
switch descriptor { 
，// 其 他 


case 语 句 不 变 


case "(Ljava/lang/String;)V": 
JStr := stack.PopRef() 
goStr := heap.GoString(]jStr) 
fmt.Println(gostr) 
，V/ 其 他 代码 不 变 


GoString () 函数 在 string_pool.go 文 件 中 ， 代 
人 码 如 下 : 


func GoString(jStr *Object) string { 
charArr := jStr.GetRefVar("value", "[C") 
return utf1i6ToString(charArr.chars()) 

} 


信人 


先 拿 到 String 对 象 的 value 变 量 值 ， 然 后 把 字符 
数组 转换 成 Go 字符 串 。Object 结 构 体 的 GetRefvar 
U 方法 (在 object.go 文 件 中 ) 如 下 : 


func (self *Object) GetrRefVar(name, descriptor string) 
*Object { 
field := self.class.getField(name, descriptor, false) 
slots := self.data.(Slots) 
return slots.GetRef(field.slotId) 


utf16ToString () 函数 在 string_pool.go 文 件 
中 ， 代 码 如 下 : 


func utf1i6ToString(s [Juint16) string { 
runes := utf16.Decode(s) // utf8 
return string(runes) 


先 把 UTF16 数 据 转 换 成 UTF8 编 码 ， 然 后 强制 
转换 成 Go 字符 串 即 可 。 一 切 就 绪 ! 重新 编译 本 章 


代码 ， 然 后 用 ch08.exe 执 行 在 第 1 章 束 已 经 出 现 过 
的 HelloWorld 程 序 。 


package jvmgo.book.cho1; 
public class Helloworld { 
public static void main(String[] args) { 
System.out.printin("Hello, world!"); 
} 
} 


久违 的 “Hello，world! ”终于 出 现在 控制 台 上 
了 ， 如 图 8-2 所 示 。 


D :\goXMworkspaceMbin>ch08. exe -Xire “C:\Program Files\Java\irel. 8.0 .66”jvmgo. boo 中 


kk. ch01. Helloyorld 
Hell1o，worldl 


D:\go\workspace\bin> 


儿 8-2 ”HelloWorld 程 序 执行 结果 


再 执行 一 个 和 微 复 杂 一 些 的 程序 : 


package jvmgo.book.ch0o8; 
public class PrintArgs { 
public static void main(String[] args) { 
for (String arg : args) { 


System.out .printJln(arg ); 
} 
} 
} 


执行 结果 如 图 8-3 所 示 。 


1 
D:\go\workspace\bin>ch08. exe -Xijre C:\Program Files\Java\irel.8.0 66 jvmgo. boole 
k, ch08. Printhrgs foo bar 你 好 ， 世 界 ! | 


D:\go\workspace\bin> Y | 


图 8-3 PrintArgs 程 序 执行 结 


8.7 “本章 小 结 


本 章 实现 了 数组 和 字符 串 ， 在 本 章 的 结尾 ， 
终于 可 以 运行 HelloWorld 程 序 了 。 不 过 美中不足 
的 是 ， 我 们 并 不 是 通过 调用 System.out.println () 
方法 ， 而 是 通过 hack 的 方式 打印 的 。 请 读者 不 要 
着 急 ， 下 一 章 会 讨论 本 地 方法 调用 ， 第 10 章 会 讨 
论 异常 处 理 。 到 了 第 11 章 ， 将 最 终 去 掉 这 个 


hack， 让 printn () 方法 真正 得 以 调用 | 


第 9 章 ”本 地 方法 调用 


在 前 面 的 8 章 里 ， 我 们 一 直 在 实现 Java 虚 拟 机 
的 基本 功能 。 我 们 已 经 知道 ， 要 想 运行 Java 程 
序 ， 除 了 Java 虚 拟 机 之 外 ， 还 需要 Java 类 库 的 配 
合 。Java 庶 拟 机 和 Java 类 库 一 起 构成 了 Java 运 行 时 
环境 。Java 类 库 主 要 用 Java 语 言 编写 ， 一些 无 法 用 
Java 语 言 实 现 的 方法 则 使 用 本 地 语言 编写 ， 这 些 
方法 叫 作 本 地 方法 。 从 本 章 开 始 ， 将 陆续 实现 一 
些 Java 类 库 中 的 本 地 方法 。 


OpenJDK 类 库 中 的 本 地 方法 是 用 JNI (Java 
Native Interface) 1 编写 的 ， 但 是 要 让 虚拟 机 支 
持 JNI 规 冰 还 需要 做 大 量 的 工作 。 由 于 本 书 的 主要 
目的 是 介绍 Java 虚 拟 机 的 工作 原理 ， 为 了 不 陷入 


JNI 规 范 的 细 世 之 中 ， 将 使 用 Go 语言 来 实现 这 些 
ps 


开始 编写 代码 之 前 ， 人 还 是 先 把 目 台 结构 准备 
好 。 复 制 ch08 目 录 ， 改 名 为 ch09。 修 改 main.go 等 
文件 ， 把 import 语 句 中 的 ch08 全 都 蔡 换 成 ch09。 在 
ch09 目 孙 下 创建 native 子 目 永 ， 本 章 新 增 的 go 文件 
主要 都 在 这 个 目录 (和 它 的 子 目 录 ) 中 。 现 在 ， 
目 邓 结构 看 起 来 是 下 面 这 个 样子 : 


D:\go\workspace\src 
| -jvmgo 
|-cho1 ~ ch08 
| -ch09 
-classfile 
-classpath 
-instructions 


-native 
-rtda 
|-cmd.go 


|-interpreter.go 
|-main.go 


[1] 
http://docs.oracle.com/javase/8/docs/technotes/guides 


/jni/spec/intro.html 


9.1 注册 和 查找 本 地 方法 


在 开始 实现 本 地 方法 之 前 ， 先 实现 一 个 本 地 
方法 注册 表 ， 用 来 注册 和 查找 本 地 方法 。 在 
ch09\native 目 孙 下 创建 registry.go， 先 在 其 中 定义 
NativeMethod 类 型 和 registry 变 量 ， 代 码 如 下 : 


package native 

import "jvmgo/cho9/rtda" 

type NativeMethod func(frame *rtda.Frame) 
var registry = map[string]lNativeMethod{} 


把 本 地 方法 定义 成 一 个 函数 ， 参 数 是 Frame 结 
构 体 指针 ， 没 有 返回 值 。 这 个 frame 参 数 吏 古本 地 
方法 的 工作 空间 ， 也 就 古 连 授 Java 虚 拟 机 和 Java 类 
库 的 桥架 ， 后 面 会 看 到 它 是 如 何 发 挥 作用 的 。 
registry 变 量 是 个 哈 希 表 ， 值 是 具体 的 本 地 方法 实 


现 。 那 么 键 是 什么 呢 ? 继续 编辑 registry.go 文 件 ， 
在 其 中 实现 Register () 画 数 ， 代 码 如 下 ; 


func Register(className, methodName, methodDescriptor 
string, method NativeMethod) { 

key := className + "~" + methodName + "~" + 
methodDescriptor 

registry[key] = method 


类 名 、 万 法 名 和 方法 手 述 牺 加 在 一 起 才能 唯 
一 确定 一 个 方法 ， 所 以 把 它们 的 组 合作 为 本 地 万 
法 注册 表 的 键 ，Register () 函数 把 前 述 三 种 信息 
和 本 地 方法 实现 关联 起 来 。 继 续 编 辑 registry.go 文 
件 ， 在 其 中 实现 FindNativeMethod () 方法 ， 代 
人 码 如 下 : 


func FindNativeMethod(className, methodName, 
methodDescriptor string) NativeMethod { 
key := className + "~" + methodName + "~" + 
methodDescriptor 
If method, ok := registry[key]; ok { 
return method 


} 
If methodDescriptor == "()V" && methodName == 


"registerNatives" { 
return emptyNativeMethod 


} 
return nil 


} 


FindNativeMethod () 方法 根据 类 名 、 方 法 

名 和 方法 描述 符 查 找 本 地 方法 实现 ， 如 果 找 不 
到 ， 则 返回 nil。 第 7 章 结尾 提 到 过 ， 
jva.lang.Object 等 类 是 通过 一 个 叫 作 registerNatives 

() 的 本 地 方法 来 注册 其 他 本 地 方法 的 。 在 本 章 
和 后 面 的 章节 中 ， 将 自己 注册 所 有 的 本 地 方法 实 
现 。 所 以 像 registerNatives () 这 样 的 方法 就 没有 
太 大 的 用 处 。 为 了 避免 重复 代码 ， 这 里 统一 处 
理 ， 如 果 遇 到 这 样 的 本 地 方法 ， 就 返回 一 个 空 的 
实现 ， 代 码 如 下 : 


func emptyNativeMethod(frame *rtda.Frame) { 
// do nothing 
} 


本 地 方法 注册 表 准 备 好 了 了， 下面 介绍 如 何 调 
用 本 地 方法 。 


9.2 ”调用 本 地 方法 


第 7 革 用 一 段 hack 代 码 来 跳 过 本 地 方法 的 执行 。 
现在 ， 终 于 可 以 把 这 段 代 码 删 除了 1! 编辑 
ch09\instructions\base\method_invoke_logic.go， 把 fmt 
包 的 导入 语句 和 InvokeMethod () 函数 中 的 hack 代 
码 删 除 。 为 了 市 约 篇 幅 ， 这 里 整 不 给 出 代码 了 。 


Java 虚 拟 机 规范 并 没有 规定 如 何 实现 和 调用 本 

地 方法 ， 这 给 了 我 们 充分 的 空间 来 发 挥 目 己 的 想象 

力 。 读 者 很 快 束 会 看 天 ， 我 们 将 利用 Java 虚 拟 机 栈 

执行 本 地 方法 ， 所 以 除了 删除 上 面 的 InvokeMethod 
() 函数 中 的 hack 代 码 之 外 ， 不 用 做 任何 修改 。 


但 是 ， 本 地 方法 并 没有 字 蔬 码 ， 如 何 利用 Java 
虚拟 机 栈 来 执行 呢 ? Java 虚 拟 机 规范 预 留 了 两 条 指 


今 


， 操 作 码 分 别 是 0xFE 和 0xFF。 下 面 将 使 用 0xFE 指 
令 来 达到 这 个 目的 。 打 开 ch09\rtda\heap\method.go 文 
件 ， 修 改 newMethods () 函数 ， 改 动 如 下 : 


func newMethods(class *Class, cfMethods 
[]j*classfile.MemberInfo) []*Method { 
methods := make([]*Method, len(cfMethods)) 
for i, cfMethod := range cfMethods { 
methods[i] = newMethod(class, cfMethod) 


return methods 


为 了 避免 newMethods () 画 数 变 得 太 长 ， 我 们 
抽取 出 一 个 hewMethod () 函数 ， 代 码 如 下 : 


func newMethod(class *Class, cfMethod *classfile.MemberInfo) 
*Method { 
method := &Method{} 
method.class = class 
method.copyMemberInfo(cfMethod) 
method.copyAttributes(cfMethod) 
md := parseMethodDescriptor(method.descriptor) 
method.calcArgSlotCount (md.parameterTypes) 
If method,.IsNative() { 
method.injectCodeAttribute(md.returnType) 
} 


return method 


粗 体 部 分 需要 解释 一 下 : 先 计 算 argSlotCount 字 
段 ， 如 采 是 本 地 方法 ， 则 注入 字 节 码 和 其 他 信息 。 
继续 编辑 method.go 文 件 ， 添 加 injectCodeAttribute 

中 态 读 代打 如 下 


func (self *Method) injectCodeAttribute(returnType string) { 
self.maxStack = 4 


self.maxLocals = self.argSlotCount 
Switch returnType[0] { 


case 'V 
ID 
F 
LW 


Case 


case ' 


Case 
Case 


i 


': sel 


self 


到 self. 


self. 


[': self. 


f.code 
,Code 


code 
code 


[Jjbyte{Oxfe, Oxb1i} // return 
[Jjbyte{Oxfe, Oxaf} // dreturn 
[Jbyte{Oxfe, Oxae} // freturn 
[Jjbyte{Oxfe, Oxad} // lreturn 


code = [J]byte{Oxfe, Oxb0} // areturn 


default: self.code = [J]Jbyte{Oxfe, Oxac} // ireturn 


} 


本 地 方法 在 class 文 件 中 没有 Code 属 性 ， 所 以 需 
要 给 maxStack 和 maxLocals 字 上 段 同 值 。 本 地 方法 由 的 
操作 数 栈 至 少 要 能 容纳 返回 值 ， 为 了 人 简化 代码 ， 和 蜀 
时 给 maxStack 宇 段 赋 值 为 4。 因 为 本 地 方法 帧 的 局 部 


变量 表 只 用 来 存放 参 


数值 ， 所 以 把 argSlotCount 赋 给 


maxLocals 字 段 刚 好 。 至 于 code 字 段 ， 也 束 是 本 地 方 


法 的 字 节 码 ， 第 一 条 指令 都 是 0xFE， 第 二 条 指令 则 
根据 函数 的 返回 值 选择 相应 的 返回 指令 。 


为 外 ， 由 于 把 方法 手 述 从 的 解析 挪 到 了 
newMethod () 函数 中 ， 所 以 calcArgSlotCount () 
方法 也 稍微 有 些 变 化 (增加 了 一 个 参数 ) ， 变 动 如 
下 : 

func (self *Method) calcArgSlotCount(paramTypes [jstring) { 


for _, paramType := range paramTypes { 
. ，// 其 他 代码 不 变 


下 面 我 们 来 实现 0xFE 指 令 。 在 ch09\instructions 
目录 下 创建 reserved 子 目录 ,然后 在 该 目录 下 创建 
invokenative.go 文 件 ， 在 其 中 定义 0xFE (后 面 称 之 为 
invokenative) 指令 ， 代 码 如 下 : 


package reserved 
import "jvmgo/cho9/instructions/base" 


import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/native" 
type INVOKE_NATIVE struct{ base.NoOperandsInstruction } 


这 个 指令 不 需要 操作 数 ，Execute () 方法 的 代 
人 码 如 下 : 


func (self *INVOKE_NATIVE) Execute(frame *rtda.Frame) { 

method := frame.Method() 

className := method.Class().Name() 

methodName := method.Name() 

methodDescriptor := method.Descriptor() 

nativeMethod := native.FindNativeMethod(className, 
methodName, methodDescriptor) 

if nativeMethod == nil { 


methodInfo := className + "." + methodName + 
methodDescriptor 
panic("java.lang.UnsatisfiedLinkError: ”+ methodInfo) 
nativeMethod(frame) 


根据 类 名 、 方 法 名 和 方法 擅 述 符 从 本 地 方法 注 
册 表 中 查找 本 地 方法 实现 ， 如 果 找 不 到 ， 则 抛 出 
UnsatisfiedLinkError 寞 种 ， 人 否则 直接 调用 本 地 方法 。 
最 后 ， 还 需要 修改 instructions\factory.go 文 件 ， 在 其 


中 添加 invokenative 指 令 有 的 case 语 句 ， 这 里 就 不 给 出 
代码 了 。 


现在 ,万事 俱 备 ， 只 人 欠 实 现 本 地 方法 ! 接 下 
来 ， 我 们 将 实现 Object 和 String 等 类 的 一 些 本 地 方 
法 。 在 后 面 儿 草 中 ， 还 会 实现 更 多 的 本 地 方法 。 


9.3 反射 


Java 的 反射 机 制 十 分 强大 ， 本 和 讨论 的 内 容 
只 是 冰山 一 角 。 


9.3.1 类 和 对 象 之 间 的 关系 


在 Java 中 ， 类 也 表现 为 普通 的 对 象 ， 它 的 类 
古 java.lang.Class。 听 起 来 有 点 像 鸡 生 蛋 还 是 重生 
鸡 的 问题 ， 类 也 是 对 象 ， 而 对 象 义 是 类 的 实例 。 
那么 在 Java 虚 拟 机 内 部 ， 拘 竟 是 多 有 类 还 是 匈 有 
对 象 呢 ? 下 面 驳 来 一 探究 竟 。 


如 前 所 述 ，Java 有 强大 的 反射 能 力 。 可 以 在 
运行 期 间 获 取 类 的 各 种 信息 、 存 取 静 从 和 实例 变 
量 、 调 用 方法 ， 等 等 。 要 想 运 用 这 种 能 力 ， 获 取 
类 对 象 中 是 第 一 步 。 在 Java 语 言 中 ， 有 两 种 方式 
可 以 获得 从 对 象 引用 : 使 用 类 字面 值 和 调用 对 和 象 
的 getClass () 方法 。 下 面 的 Java 代 码 演 示 了 这 两 
种 方 起 


System.out .println(String,.class ) ; 
System.out.printlin("abc".getClass()); 


在 第 6 章 中 ， 通 过 Object 结构 体 的 class 字 段 建 
立 了 类 和 对 象 之 间 的 单 癌 关系 。 现 在 把 这 个 关系 
补充 完整 ， 让 它 成 为 双向 的 。 打 开 
ch09\rtda\heap\class.go 文 件 ， 修 改 Class 结 构 体 ， 添 
加 jClass 字 段 ， 改 动 如 下 : 


Sp 2 struct { 
其 他 字段 


jClass *0bject // java.lang.Class 实 例 


通过 jClass 字 段 ， 每 个 Class 结 构 体 实例 都 与 一 
个 类 对 象 天 联 。 男 外 需要 给 jClass 字 上 段 定义 Getter 
方法 ， 代 码 比较 简单 ， 了 吏 不 给 出 了 。 下 面 打 开 


ch09\rtda\heap\object.go 文 件 ， 修 改 Object 结 构 体 ， 
添加 extra 字 上 段 ， 改 动 如 下 : 


type Object struct { 
class *Class 
data interfacef{} 
extra interface{} 


} 


extra 字 段 用 来 记录 Object 结构 体 实例 的 额外 信 

。 同样 给 它 定 义 Getter 和 Setter 方 法 ， 这 里 就 不 
给 出 代码 了 。 这 个 字段 之 所 以 是 interface{} 类 型 ， 
是 因为 它 在 后 面 儿 间 还 会 有 其 他 用 途 。 本 章 ， 只 
用 它 来 记录 类 对 象 对 应 的 Class 结 构 体 指针 。 


如 果 读 者 读 a 到 这 里 感觉 有 些 吃力 ， 请 不 要 人 怀 
疑 目 己 的 理解 能 力 ， 一定 是 笔 关 表 达 得 不 够 好 。 
万 外 ， 笔 着 在 写 这 一 时 ， 目 己 也 是 犯 了 很 多 次 
迷 灶 的 。 为 了 帮助 大 家 更 好 地 理解 类 和 对 象 之 间 


的 天 系 ， 让 我 们 想象 这 样 一 个 极 售 化 的 Java 虚 拟 
机 运行 时 状态 ， 方法 区 中 只 加 载 了 两 个 类 ， 
java.lang.Object 和 java.lang.Class; 堆 中 只 通过 new 


指令 分 配 了 一 个 对 象 。 此 时 Java 虚 拟 机 的 内 存 状 
态 如 图 9-1 所 示 。 


Heap Method Area 


class1 


name: java.lang.Object 
objec 世 superClass 
class JClass 

extra 


class2 
name: java.lang.Class 


superClass 
jClass 


图 9-1 类 和 对 象 关系 图 


图 9-1 只 画 出 了 Class 和 Object 结构 体 的 必要 字 

段 ， 并 且 刻 意 分 开 了 堆 和 方法 区 。 在 方法 区 中 ， 
class1 和 class2 分 别 是 java.lang.Object 和 
java.lang.Class 类 有 的 数据 。 在 堆 中 ，object1 和 
object2 分 别 是 java.lang.Object 和 java.lang.Class 的 类 
对 象 。object3 是 单独 的 java.lang.Object 实 例 。 虽 然 

已 经 简化 到 了 极点 ， 但 仍然 有 8 条 箭头 ， 和 希望 有 窗 
集 芍 惯 症 的 读者 不 要 被 是 倒 。 


[1] 在 本 书 中 ， 类 对 象 特 指 javalang.Class 类 的 实 
例 ， 对 象 泛 指 任何 类 的 实例 。 


93.2 履 政 类 加 下 证 


Class 和 Object 结构 体 准 备 好 了 ， 接 下 来 修改 
类 加 载 右 ， 让 每 一 个 加 载 到 方法 区 中 的 类 都 有 一 
个 类 对 象 与 之 相关 联 。 打 开 
ch09\rtda\heap\class_loader.go 文 件 ， 修 改 
NewClassLoader () 男 数 ， 改 动 如 下 : 


func NewClassLoader(cp *classpath.Classpath, verboseFlag 
bool) *ClassLoader { 

loader := &ClassLoadert 

cp: cp, 

verboseFlag: verboseFlag, 

classMap: make(map[string]*Class), 
} 
loader .loadBasicClasses() 
return loader 


在 返回 ClassLoader 结 构 体 实例 之 前 ， 先 调用 
loadBasicClasses () 画 数 。 这 个 函数 也 要 添加 到 


class_loader.go 文 件 中 ， 代 码 如 下 : 


func (self *ClassLoader) loadBasicClasses() { 
JlClasscClass := self.LoadCclass("java/lang/Class") 
for _, class := range self.classMap { 
if class.jClass == nil { 
class.jClass = jlClassClass.NewObject() 
class.jClass.extra = class 


loadBasicClasses () 函数 移 加 载 
java.lang.Class 类 ， 这 又 会 触发 java.lang.Object 等 
类 和 接口 的 加 和 载 。 然 后 遇 历 classMap， 给 已 经 加 
载 的 每 一 个 类 关隘 尖 对 象 。 好 啦 ， 问 题 已 经 解决 
了 一 半 。 下 面 修改 LoadClass () 方法 ， 解 决 另 一 
半 问 题 。 改 动 较 大 ， 人 代码 如 下 : 

func (self *ClassLoader) Loadclass(name string) *Class { 


if class, ok := Self,classMap[name]; ok { 
return class // already loaded 


var class *Class 

If name[0] == '[' { // array class 
class = self.1loadArrayClass(name) 

} else { 


class = self.loadNonArrayClass(name) 


if jlLClassClass，ok := self.classMap["java/lang/Class"]; 
ok { 


class.jClass = jlClasscClass.NewObject() 
class.jClass.extra = class 


return class 


} 


主要 的 变动 古 粗 体 部 分 。 在 类 加 载 完 之 后 ， 
看 java.lang.Class 是 否 已 经 加 载 。 如 果 是 ， 则 给 类 
关联 类 对 象 。 这 样 ， 在 loadBasicClasses () 和 
LoadClass () 方法 的 配合 之 下 ， 所 有 加 载 到 方法 
区 的 类 都 设置 好 了 jClass 字 段 。 


9.3.3 ”基本 类 型 的 类 


void 和 基本 类 型 也 有 对 应 的 类 对 象 ， 但 只 能 
通过 字面 值 来 访问 ， 如 下 面 的 Java 代 人 码 所 示 。 


System.out.println(void.class); 
System.out.println(boolean.class); 
System.out.println(byte.class); 
System.out.println(char.class); 
System.out.println(short.class); 
System.out.println(int.class); 
System.out.println(long.class); 
System.out.println(float.class); 
System.out.println(double.class); 


和 数组 类 一 样 ， 基 本 类 型 的 类 也 是 由 Java 虚 
拟 机 在 运行 期 间 生 成 的 。 继 续 编 辑 class_loader.go 
文件 ， 修 改 NewClassLoader () 画 数 ， 在 其 中 添 
加 如 下 一 行 代码 : 


func NewClassLoader(cp *classpath.Classpath, verboseFlag 
bool) *ClassLoader { 
，V// 前 面 的 代码 不 变 


Joader ,LoadBasicCJlasses( ) 
Joader ,oadPrimitiveClLasses( ) 
return loader 


loadPrimitiveClasses () 方法 加 载 void 和 基本 
类 型 的 类 ， 代 码 如 下 : 


func (self *ClassLoader) loadPrimitiveClasses() { 
for primitiveType, _ := range primitiveTypes { 
self.loadPrimitiveClass(primitiveType) // 


primitiveType 是 


VOL1Id 、 
int、 


float 等 


生成 void 和 基本 类 型 类 的 代码 在 
loadPrimitiveClass () 方法 中 ， 代 码 如 下 : 


func (self *ClassLoader) loadPrimitiveClass(className 
string) { 
class := &Classt 
accessFlags: ACC_PUBLIC, 


name : className, 
loader: self, 
initStarted: true, 


class.jClass = 
self.classMap["java/lang/Class"].NewObject() 

class.jClass.extra = class 

self.classMap[className|] = class 


} 


这 里 有 三 点 需要 说 明 。 第 一 ，void 和 基本 类 
型 的 类 名 就 是 void 、int、float 等 。 第 二 ， 基 本 类 
型 的 类 没有 超 类 ， 也 没有 实现 任何 接口 。 第 二 ， 
非 基本 类 型 的 类 对 象 是 通过 ldc 指 令 加 载 到 操作 效 
栈 中 的 ， 将 在 9.3.4 世 修改 dc 指令 ， 证 它 文 持 类 对 
象 。 而 基本 类 型 的 类 对 象 ， 虽 然 在 Java 代 码 中 看 
起 来 是 通过 字面 量 获取 的 ， 但 是 编译 之 后 的 指令 
并 不 是 ldc， 而 是 getstatic。 每 个 基本 类 型 都 有 一 个 
包 闻 类 ， 包 凌 类 中 有 一 个 静态 音量 ， 叫 作 TYPE， 
其 中 存放 的 驶 是 基本 类 型 的 类 。 例 如 
java.lang.Integer 类 ， 代 码 如 下 : 


public final class Integer extends Number implements 
Comparable<Integer> { 
,，，// 其 他 代码 


@Suppresswarnings("unchecked") 
public static final Class<Integer> TYPE 
= (Class<Integer>) Class.getPrimitiveClass("int"); 
，// 其 他 代码 


也 束 是 说 ， 基 本 类 型 的 类 是 通过 getstatic 指 令 
访问 相应 包 竣 类 的 TYPE 字 段 加 载 到 操作 数 栈 中 
的 。Class.getPrimitiveClass () 是 个 本 地 方法 ， 将 
任 9.3.5 太 实现 它 。 包 淡 类 将 在 9.7 小 方 评 细 讨论 。 


9.3.4 修改 Idc 指 令 


和 基本 类 型 、 字 符 串 字面 信 一 样 ， 类 对 象 字 
面值 也 是 由 ldc 指 令 加 载 的 。 本 市 修改 ldc 指 令 ， 让 
它 可 以 加 载 类 对 象 。 打 开 
ch09\instructions\constants\ldc.go 文 件 ， 修 改 _ldc 

WU 画 数 ， 改 动 如 下 : 


func _ldc(frame *rtda.Frame, index uint) { 


stack := frame.OperandStack() 
class := frame.Method().class() 
c := class.ConstantPool().GetConstant(index) 


Switch c.(type) { 

case Int32: ... 

case float32: ... 

case string: ... 

case *heap.ClassRef: 
classRef := c.(*heap.ClassRef) 
classobj := classRef.ResolvedClass().JClass() 
stack.PushRef (class0bj) 

default: ... 


以 上 只 是 增加 了 一 个 case 语 句 ， 其 他 地 方 没 
什么 变化 。 如 果 运 行 时 ， 常 量 池 中 的 常量 是 类 引 
用 ， 则 解析 类 引用 ， 然 后 把 类 的 类 对 象 推 入 操作 
数 栈 顶 。 


9.3.5 “通过 反射 获取 类 名 


为 了 文 持 通过 反射 获取 类 名 ， 本 小 将 实现 
以 下 4 个 本 地 方法 : 


-java.lang.Object.getClass () 
‘java.lang.Class.getPrimitiveClass () 
-java.lang.Class.getName0 () 


-java.lang.Class.desiredAssertionStatus0 () 


Object.getClass () 就 不 用 多 说 了 ， 它 返回 对 
象 的 类 对 和 象 引 用 。Class.getPrimitiveClass () 在 
9.3.3 玫 提 到 过 ， 基 本 类 型 时 包 闻 类 在 初始 化 时 会 
调用 这 个 方法 给 TPYE 字 上 段 赋值 。Character 类 是 基 


本 类 型 char 的 包装 类 ， 它 在 初始 化 时 会 调用 
Class.desiredAssertionStatus0 () 方法 ， 所 以 这 个 
方法 也 需要 实现 。 最 后 ， 之 所 以 要 实现 getName0 

() 方法 ， 是 因为 Class.getName () 方法 是 依赖 
这 个 本 地 方法 工作 的 ， 该 方法 的 代码 如 下 : 


// java.lang.Class 
public String getName() { 
String name = this.name; 
if (name == null) 
this.name = name = getName0()，; 
return name; 


3 


在 ch09native 目 杂 下 创建 java 子 目录 ， 在 java 
子 目录 下 创建 lang 子 目录 ， 然 后 在 lang 目 录 中 创建 
Object.go 文 件 ， 在 其 中 注册 getClass () 本 地 方 
法 ， 代 码 如 下 : 


package lang 

import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
func init() { 


native.Register("java/lang/Object", "getClass", " 
()Ljava/lang/Class;", getClass) 


继续 编辑 Object.go， 实 现 getClass () 函数 ， 
代码 如 下 : 


// public final native Class<?> getClass(); 
func getClass(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis!() 
class := this.Class().JClass() 
frame.OperandSstack().PushrRef(class) 


这 是 实现 的 第 一 个 本 地 方法 ， 所 以 有 必要 详 
细 解 释 一 下 。 首 先 ， 从 局 部 变量 表 中 拿 到 this 引 
用 。GetThis () 方法 其 实 就 是 调用 GetRef 

(0) ， 不 过 为 了 提高 代码 的 可 读 性 ， 给 LocalVars 
结构 体 添 加 了 这 个 方法 。 有 了 this 引 用 后 ， 通 过 
Class () 方法 拿 到 它 的 Class 结 构 体 指针 ， 进 而 又 
通过 JClass () 方法 拿 到 它 的 类 对 象 。 最 后 ， 把 类 


对 象 推 入 操作 效 栈 顶 。 这 样 ， 只 用 了 3 行 代码 ， 
Object.getClass () 方法 承 实 现 好 了 。 


在 ch09native\java\lang 目 杂 下 创建 Class.go 文 
件 ， 在 其 中 注册 3 个 本 地 方法 ， 代 码 如 下 : 


package lang 
import "jvmgo/ch09/native" 
import "jvmgo/choO9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("java/lang/Class", "getPrimitiveClass", 
"(Ljava/lang/String;)Ljava/lang/Class;", 
getPrimitiveClass) 
native.Register("java/lang/Class", "getNameQO", " 
()Ljava/lang/String;", getName0) 
native.Register("java/lang/Class", 
"desiredAssertionSstatus0O", 
"(Ljava/lang/Class; )Z"，desiredAssertionStatus0 ) 
} 


先 实现 getPrimitiveClass () 方法 ， 代 码 如 
下 : 


// static native Class<?> getPrimitiveClass(String name); 
func getPprimitiveClass(frame *rtda.Frame) { 

nameobj := frame.LocalVars().GetrRef(0) 

name := heap.GoString(name0bj) 


loader := frame.Method(),Class().Loader() 
class := loader.LoadClass(name).JClass() 
frame.OperandSstack().PushrRef(class) 


getPrimitiveClass () 是 静态 方法 。 先 从 局 部 
变量 表 中 拿 到 类 和 名， 这 是 个 Java 字 符 嘻 ， 需 要 把 
它 转 成 Go 字符 串 。 基 本 类 型 鸭 类 已 经 加 载 到 了 方 
法 区 中 ， 直 接 调 用 类 加 载 器 的 LoadClass () 方法 
获取 即 可 。 最 后 ， 把 类 对 象 引 用 推 入 操作 数 栈 
顶 。 下 面 实现 getrName0 () 方法 ， 代 码 如 下 : 


// private native String getName0(); 
func getNameO(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
class := this.Extra().(*heap.Class) 
name := class.JavaName() 
nameobj := heap.JString(class.Loader(), name) 
frame.OperandSstack().PushrRef (nameO0bj) 


首先 从 局 部 变量 表 中 拿 到 this 引 用 ， 这 是 一 个 
类 对 象 引 用 ， 通 过 Extra () 方法 可 以 获得 与 之 对 


应 的 Class 结 构 体 指针 。 然 后 拿 到 类 名 ， 转 成 Java 

字符 串 并 推 入 操作 数 栈 顶 。 注 意 这 里 需要 的 是 

java.lang.Object 这 样 的 类 和 名， 而 非 

java/lang/Object。Class 结 构 体 的 JavaName () 方 
返回 转换 后 的 类 名 ， 代 码 如 下 : 


func (self *Class) JavaName() string { 
return strings.Replace(self.name, "/", ".", -1) 


} 


本 书 不 讨论 断言 。desiredAssertionStatus0 
() 方法 把 false 推 入 操作 数 栈 顶 ， 代 码 如 下 : 


// private static native boolean 

desiredAssertionStatus0(Class<?> clazz); 

func desiredAssertionStatuso(frame *rtda.Frame) { 
frame.OperandSstack().PushBoolean(false) 


4 个 本 地 方法 都 实现 好 了 ， 而 且 也 已 经 在 init 
() 画 数 中 注册 ， 那 么 可 以 进行 测试 了 吗 ? 还 不 


行 ， 因 为 init () 函数 还 没有 机 会 执行 。 编 辑 
chO9\instructions\reserved\invokenative.go 文 件 ， 在 


其 中 导入 lang 包 ， 代 码 如 下 : 


package reserved 

import "jvmgo/ch09/instructions/base" 
import "jvmgo/cho9/rtda" 

import "jvmgo/ch09/native" 

import _ "jvmgo/cho9/native/java/lang" 


如 果 没 有 任何 包 依 赖 lang 包 ， 它 就 不 会 被 编 

进 可 执行 文件 ， 上 面 的 本 地 方法 也 丈 不 会 外 注 
册 。 上 所 以 需要 一 个 地 方 导 入 lang 包 ， 把 它 放 在 
invokenative.go 文 件 中 。 由 于 没有 显示 使 用 lang 中 
的 变量 或 范 数 ， 所 以 必须 在 包 名 前 面 加 上 下 划 
线 ， 人 否则 无 法 通过 编译 。 这 个 技术 在 Go 语言 中 是 


作 “import for side effect”。 上 


[1] 
https://golang.org/doc/effective_go.html#blank_impo 


It 


9.3.6 ”测试 本 节 代 码 


打开 命令 行 窗 口 ， 执 行 下 面 的 命令 编译 本 章 
代码 : 


go install jvmgo\ch09 


命令 执行 完毕 后 ， 在 D:，\govworkspace\bin 目 
采 下 出 现 ch09.exe 文 件 。 用 ch09.exe 运 行 下 面 的 
Java 程 序 : 


package jvmgo.book.cho9 ; 
public class GetClassTest { 
public static void main(String[] args) { 

System.out.println(void.class.getName()); // void 
System.out.printin(boolean.class.getName()); // boolean 
System.out.println(byte.class.getName()); // byte 
System.out.println(char.class.getName()); // char 
System.out.printin(short.class.getName()); // short 
System.out.printin(int.class.getName()); // int 
System.out.printin(long.class.getName()); // long 
System.out.printin(float.class.getName()); // float 
System.out.println(double.class.getName()); // double 
System.out.printin(Object.class.getName()); // 

java.1lang.Object 
System.out.printin(int[].class.getName()); // [I 


System.out.printin(int[][].class.getName()); // [I[I 

System.out.printin(Object[].class.getName()); // 
[Ljava.1lang.oObject; 

System.out.printin(Object[][].class.getName()); // 


[[Ljava.1lang.oObject; 
System.out.printlin(Runnable.class.getName()); // 


JjJava.1lang.Runnable 
System.out.printin("abc".getClass().getName()); // 


Java.1lang.String 
System.out.printin(new double[0].getClass().getName()); 
// [D 
System.out.printin(new String[0].getClass().getName()); 
//[Ljava.lang.Sstring; 
} 


} 


k. ch09. GetClassTest 
void 
boolean 


岁 9-2 ”GetClassTest 程 序 执行 结 


9.4 字符 串 拼 接 和 String.intern () 方 
法 


9.4.1 Java 类 库 


在 Java 语 诗 中 ， 通 过 加 号 来 拼接 字符 串 。 作 
为 优化 ，javac 编 辑 侣 会 把 字符 串 拼 接 控 作 转 换 成 
StringBuilder 的 使 用 。 例 如 下 面 这 段 Java 代 码 : 


String hello = "hello,"; 
String world = "world!"; 
String str = hello + world; 
System.out.printlin(str); 


很 可 能 会 被 javac 优 化 为 下 面 这 样 : 


String str = new 
StringBuilder().append( "hello,").append("world!").toString() 


System.out.printlin(str); 


为 了 运行 上 面 的 代码 ， 本 和 将 实现 以 下 3 个 本 
地 方法 : 


‘System.arrayCopy () 
Float.floatToRawIntBits () 
‘Double.doubleToRawLongBits () 


这 些 方 法 是 在 哪里 使 用 的 呢 ? 
StringBuilder.append () 方法 只 是 调用 了 超 类 的 
append () 方法 ， 代 码 如 下 : 


// java.lang.StringBuilder 

@Override 

public StringBuilder append(String str) { 
super.append(str); // 调用 


AbstractStringBuilder .append() 
return this,; 


- 


AbstractStringBuilderappend () 方法 调用 了 
String.getChars () 方法 获取 字符 数组 ， 代 码 如 
下 : 


// java.lang.AbstractStringBuilder 

public AbstractStringBuilder append(String str) { 
if (str == null) return appendNull(); 
int len = str.length(); 
ensureCapacityInternal(count + len); 
str.getchars(0, len, value, count); 
count += len; 
return this,; 


String.getChars () 方法 调用 了 
System.arraycopy () 方法 拷贝 数组 ， 代 码 如 下 : 


// java.lang.Sstring 
public void getChars(int srcBegin, int srcEnd, char dst[]， 
int dstBegin) { 

, ,，// 其 他 代码 


System.arraycopy(value, srcBegin, dst, dstBegin, srcEnd - 
srcBegin); 
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StringBuildertoString () 方法 的 代码 如 下 : 


// java.lang.StringBuilder 
Q@Override 
public String toString() { 
// Create a copy, don't share the array 
return new String(value, ©0, count); 


它 调 用 了 String 的 构造 函 数 ， 这 个 构造 函数 调 
用 了 Arrays.copyOfRange () 方法 ， 代 码 如 下 : 


// java.lang.Sstring 
public String(char value[], int offset, int count) { 
, ,，// 其 他 代码 


this.value = Arrays.copyOfRange(value, offset, 
offset+count ) ; 


} 


Arrays.copyOfRange () 调用 了 Math.min () 
方法 ， 代 码 如 下 : 


// java.util.Arrays 
public static char[] copyofRange(char[] original, int from, 
int to) { 

int newLength = to - from; 


If (newLength < 0) throw new 
IllegalArgumentException(from + " > " + to); 
char[] copy = new char[newLength]; 
System.arraycopy(original, from, copy, 0, 
Math.min(original.1length - from, 
newLength ) ) ， 
return Copy 


} 


Math 类 在 初始 化 时 需要 调用 
Float.floatToRawIntBits () 和 
Double.doubleToRawLongBits () 方法 ， 代 码 如 
下 : 


package java.1lang; 
public final class Math { 

// Use raw bit-wise conversions on guaranteed non-NaN 
arguments. 

private static long negativeZzeroFloatBits 
Float.floatToRawInNtBits(-0.0Of); 

private static long negativeZeroDoubleBits 
Double.doubleToRawLongBits(-0.0d); 


} 


Java 类 库 介 绍 完 了 ， 下 面 实现 本 地 方法 。 


9.4.2 System.arraycopy () 方法 


在 ch09vativeMjavaNang 目 永 下 创建 System.go 
文件 ， 在 其 中 注册 arraycopy () 方法 ， 代 码 如 
下 : 


package lang 
import "jvmgo/cho9/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("java/lang/System", "arraycopy", 
"(Ljava/lang/Object;ILjava/lang/Object;II)V", 
arraycopy) 


继续 编辑 System.go， 实 现 arraycopy () 方 
。 代码 稍微 有 些 复杂 ， 先 来 看 第 一 部 分 。 


// public static native void arraycopy( 
// Object src, int srcPos, Object dest, int destPos, int 


length) 

func arraycopy(frame *rtda.Frame) { 
vars := frame.LocalVars() 
src := Vars.GetRef(0) 


srcPos := vars.GetInt(1) 


dest := vars.GetRef(2) 
destPos := Vars,GetInt(3) 
length := Vars.GetInt(4) 


完 从 局 部 变量 表 中 拿 公 5 个 参数 。 源 数组 和 目 
标 数 组 都 不 能 是 null， 否 则 按照 System 类 的 
Javadoc 应 该 掀 出 NullPointerException 异 常 ， 代 码 
如 下 : 


if src == nil || dest == nil { 
panic("java.lang.NullPointerException") 


源 数组 和 目标 数组 必须 兼容 才能 拷贝 ， 否 则 
应 该 抛 出 ArrayStoreExceptio 异 常 ， 代 人 码 如 下 : 


ArrayStoreExceptio 异 常 ， 代 码 如 下 : 


If !checkArrayCopy(src, dest) { 
panic("java.1lang.ArrayStoreException") 


checkArrayCopy 〈) 函数 的 代码 稍 后 给 出 。 
接 下 来 检查 srcPos、destPos 和 ]length 参 数 ， 如 果 有 
问题 则 抛 出 mdexOutOfBoundsException 寞 党 ， 代 
码 如 下 : 


if srcPos < 0 || destPos < 0 || length < 0 || 
srcPos+length > src.ArrayLength() || 
destPos+length > dest.ArrayLength() { 
panic("java.lang.IndexOutOfBoundsException") 


最 后 ， 参 数 合 法 ， 调 用 ArrayCopy () 函数 进 
行 数组 拷贝 ， 代 码 如 下 : 


heap.ArrayCopy(src, dest, srcPos, destPos, length) 
} 


checkArrayCopy () 函数 首 移 确 保 src 和 dest 
都 是 数组 ， 然 后 检查 数组 类 型 。 如 有 果 两 者 都 是 引 


用 数组 ， 则 可 以 拷贝 ， 否 则 两 痢 必须 是 相同 类 型 
的 基本 类 型 数组 ， 代 码 如 下 : 


func checkArrayCopy(src, dest *heap.0Object) bool { 


srcClass := src.Class() 
destClass := dest.Class() 
if !srcClass.IsArray() || 'destClass.IsArray() { 


return false 


if srcClass.ComponentClass().IsPrimitive() || 
destClass.ComponentClass().IsPrimitive() { 
return srcClass == destClass 


} 


return true 


Class 结 构 体 的 IsPrimitive () 函数 判断 类 是 
否 是 基本 类 型 的 类 ， 代 码 如 下 : 


func (self *Class) IsPrimitive() bool { 
_, Ok := primitiveTypes[self.namel] 
return ok 


真正 的 数组 揽 贝 逻辑 在 
ch09\rtda\heap\array_object.go 文 件 中 ， 代 码 如 下 : 


func ArrayCopy(src, dst *Object, srcPos, dstPos, length 


int32) { 
switch src.data.(type) { 
Case ... 
case [1]int32: 
_Src := src.data.([]int32)[srcPos : srcPpos+length] 


_dst := dst.data,([]int32)[dstPos : dstPpos+length] 
copy(_dst, _src) 

case []*object : 
_Src := src.data,([]*object)[srcPos : srcPos+length] 
_dst := dst.data,([]*object)[dstPos : dstPos+length] 
copy(_dst, _src) 


利用 Go 的 内 置 画 数 copy () 进行 Slice 拷贝 。 
为 了 节约 篇 幅 ， 上 面 的 代码 只 给 出 了 int 数 组 和 对 
象 数 组 的 case 语 句 ， 其 他 情况 代码 大 辣 小 有 异 。 


9.4.3 Float.floatToRawIntBits () 和 


Double.doubleToRawLongBits () 方法 


Float.floatToRawIntBits () 和 
Double.doubleToRawLongBits () 返回 浮 点 数 的 编 
码 ， 这 两 个 方法 大 同 小 异 ， 以 Float 为 例 进行 介 
绍 。 在 ch09native\java\llang 目 杂 下 创建 Float.go 文 
件 ， 在 其 中 注册 floatToRawIntBits () 本 地 方法 ， 
代码 如 下 : 


package lang 
import "math" 
import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
func init() { 
native.Register("java/lang/Float", 
"floatToRawIntBits", "(F)I", floatToRawIntBits) 
} 


Go 语言 的 math 包 提供 了 一 个 类 似 函 数 : 
Float32bits () ， 正 好 可 以 用 来 实现 floatToRaw- 
IntBits () 方法 ， 代 码 如 下 : 


// public static native int floatToRawIntBits(float value); 
func floatToRawIntBits(frame *rtda.Frame) { 
value := frame.LocalVars().GetFloat(0) 
bits := math.Float32bits(value) 
frame.OperandSstack().PushIint(int32(bits)) 
} 


9.4.4 String.intern () 方法 


第 8 章 讨论 字符 串 时 ， 实 现 了 字符 串 池 ， 但 它 
只 能 在 虚拟 机 内 部 使 用 。 下 面 实现 String 类 的 
intern () 方法 ， 让 Java 类 库 也 可 以 使 用 它 。 在 
ch09ativeMjavalang 目 永 下 创建 String.go， 在 其 中 
注册 intern () 方法 ， 代 码 如 下 : 


package lang 
import "jvmgo/cho9/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("java/lang/String", "intern", " 
()Ljava/lang/String;", intern) 


继续 编辑 String.go 文 件 ， 实 现 intern () 方 
法 ， 代 码 如 下 : 


// public native String intern(); 
func intern(frame *rtda.Frame) { 


this := frame.LocalVars().GetThis!() 
interned := heap.InternString(this ) 
frame.OperandSstack().PushRef(interned) 


如 末 字 符 串 还 没有 入 池 ， 把 它 放 入 并 返回 该 
字符 昌 ， 人 否则 找到 已 入 池 字 人 符 串 并 返回 。 这 个 逻 
辑 在 InternString () 画 数 中 
(ch09\rtda\heap\string_pool.go) ， 代 码 如 下 : 


func InternString(jStr *Object) *Object { 
goStr := GoString(jStr) 
if internedStr, ok := internedStrings[goStr]; ok { 
return internedStr 


internedStrings[goStr] = jStr 
return jStr 


字符 串 相 关 的 本 地 方法 都 实现 好 了 ， 下 面 我 
们 进行 测试 。 


9.45 ”测试 本 节 代 码 


下 面 的 Java 程 序 对 字符 串 拼接 和 入 池 进 行 了 测 
试 。 


package jvmgo.book.cho9; 
public class StringTest { 
public static void main(String[] args) { 

String S1 = "abci1"; 
String s2 = "abci1"; 
System.out.printin(s1 == s2); // true 
int x = 1; 
String s3 = "abc" + x; 
System.out.printin(s1 == s3); // false 
s3 = s3.intern(); 
System.out.printin(s1 == s3); // true 


重新 编译 本 章 代 人 码 ， 然 后 测试 StringTest 程 
序 ， 结 果 如 图 9-3 所 示 。 


图 9-3 ”StringTest 程 序 执行 结 果 


9.5 Object.hashCode () 、~equals () 


和 toString () 


Object 类 有 3 个 非常 重要 的 方法 : hashCode 
() 返回 对 象 的 哈 希 码 ; equals () 用 来 比较 两 个 


对 象 是 否 “ 相 同 ”，toString () 返回 对 象 的 字符 串 
表示 。hashCode () 是 个 本 地 方法 ，equals () 和 
toString () 则 是 用 Java 写 的 ， 它 们 的 代码 如 下 : 


package java.1lang; 
public class Object { 


.. // 


本 玉 


其 他 代码 省 略 


public native int hashcode() ， 
public boolean equals(Object obj) { 
return (this == obj); 


} 
public String toString() { 
return getclass().getName() + "@" + 
Integer.toHexString(hashCode( )); 
} 


} 


下 面 实现 hashCode () 方法 。 打 开 
ch09nativeMjavalang\Object.go， 导 入 unsafe 包 并 注 
册 hashCode () 方法 ， 代 码 如 下 : 


package lang 
import "unsafe" 
import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
func init() { 
native.Register("java/lang/Object", "getClass", " 
()Ljava/lang/Class;", getClass) 
native.Register("java/lang/Object", "hashCode", "()I", 
hashCode) 
} 


继续 编辑 Object.go， 实 现 hashCode () 方 
法 ， 代 码 如 下 : 


// public native int hashCode(); 

func hashCode(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
hash := int32(uintptr(unsafe.Pointer(this))) 
frame.OperandStack().PushInt(hash) 

} 


把 对 象 引 用 《Object 结构 体 指针 ) 转换 成 
uintptr 类 型 ， 然 后 强制 转换 成 int32 推 入 操作 数 栈 


顶 。 


2 只 实现 3 ne 重新 编译 本 章 
代码 ， 然 后 测试 下 面 的 Java 程 序 : 


package jvmgo.book.cho9; 
public class ObjectTest { 
public static void main(String[] args) { 

Object obj1 = new ObjectTest(); 
Object obj2 = new ObjectTest(); 
System.out.printlin(obj1.hashCode( )); 
System.out.printlin(obj1.toSstring( )); 
System.out.printlin(obj1i.equals (obj2)); 
System.out.println(obj1i.equals(obj1)); 


ObjectTest 程 序 执行 结果 如 图 9-4 所 示 。 


本 命令 反 示 符 一 口 xX 


k. ch09. OQbjectTest 
-2109091616 
]ymgo. book, ch09, ObjectTest@8249d0e0 


D:\go\workspace\bin> 


图 9-4 ”ObjectTest 程 序 执行 结果 


9.6 Object.clone () 


Object 类 提供 了 clone () 方法 ， 用 来 支持 对 
象 元 隆 。 这 也 是 一 个 本 地 方法 ， 代 人 码 如 下 : 


// java.lang.Object 
protected native Object clone() throws 
CloneNotSupportedException; 


本 太 实 现 这 个 方法 。 在 
ch09native\java\lang\Object.go 文 件 中 注册 clone 
() 方法 ， 代 码 如 下 : 


func init() { 

native.Register(jl0Object, "getClass", " 
()Ljava/lang/Class;", getClass) 

native.Register(jl0Object, "hashCcode", "()I", hashCode) 

native.Register(jlObject, "clone", "()Ljava/lang/Object;", 
clone) 


继续 编辑 Object.go， 实 现 clone () 方法 ， 代 
人 码 如 下 : 


func clone(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis() 
cloneable := 
this.Class().Loader().LoadClass("java/lang/Cloneable") 
if !this.Class().IsImplements(cloneable) { 
panic("java.lang.CloneNotSupportedException") 


frame.OperandStack().PushRef(this.cClone()) 
} 


如 果 类 没有 实现 Cloneable 接 口 ， 则 抛 出 
CloneNotSupportedException 异 常 ， 否 则 调用 Object 
结构 体 的 Clone () 方法 克隆 对 象 ， 然 后 把 对 象 副 
本 引用 推 入 操作 数 栈 顶 。Clone () 实现 稍微 有 些 
长 ， 把 它 放 在 ch09\rtda\heap\object_clone.go 文 件 
中 ， 代 码 如 下 : 


func (self *Object) Clone() *Object { 
return &0bject{ 
class: self.class, 
data: self.cloneData(), 


数据 克隆 逻辑 在 cloneData () 了 范 数 中 ， 代 码 
如 下 : 


func (self *Object) cloneData() interface{} { 

Switch self.data.(type) { 

case []int8: ... 

case []int16: ... 

case [J]Juint16: ... 

case []int32: ... 

case []int64: ... 

case [J]float32: ... 

case [J]float64: ... 

case []*Object: 
elements := Self.data.([]*object ) 
elements2 := make([]*Object, len(elements)) 
copy(elements2, elements) 
return elements2 

default: // []Slot 
slots := self.data. (Slots) 
slots2 := newSlots(uint(len(slots))) 
copy(slots2, slots) 
return slots2 


注意 ， 数 组 也 实现 了 Cloneable 接 口 ， 所 以 上 
面 代 码 中 的 case 语 句 计 对 各 种 数组 进行 处 理 。 因 为 


代码 都 大 同 小 异 ， 所 以 只 给 出 了 引用 数组 的 case 语 
人 句 。default 语 句 对 普通 对 象 进行 克 隆 。 


重新 编译 本 章 代 码 ， 测 试 下 面 的 Java 程 序 。 


package jvmgo.book.cho9; 
public class CloneTest implements Cloneable { 
private double pi = 3.14; 
Q@Override 
public CloneTest clone() { 
try { 
return (CloneTest) super.clone(); 
} catch (CloneNotSupportedException e) { 
throw new RuntimeException(e); 


public static void main(String[] args) { 
CloneTest obj1 = new CloneTest(); 
CloneTest obj2 = obj1.clone(); 
obj1,pi = 3.1415926; 
System.out.printJln(obj1.pI); 
System.out.printlin(obj2.pi); 


CloneTest 程 序 执行 结果 如 图 9-5 所 示 。 


| 园 命令 提示 符 — 口 x 


vace\bin>ch09. exe -Xjre “C:\Program Files\Java\jrel.8.0 .66” jvmgo. bool 
¢. Ch09. CloneTest 
3. 1415926 
3. 14 


:\go\workspace\bin> 


图 9-5 ”CloneTest 程 序 执行 结 


9.7” 目 芒 竣 箱 和 拆 箱 


前 面 讨 论 过 ， 为 了 更 好 地 融入 Java 的 对 象 系 
统 ， 每 种 基本 类 型 都 有 一 个 包 洲 类 与 之 对 应 。 从 
Java 5 开始 ，Java 语 法 增加 了 目 动 闭 箱 和 拆 箱 
(autoboxing/unboxing) 能 力 ， 可 以 在 必要 时 把 基 
本 类 型 转换 成 包装 类 型 或 者 反之 。 这 个 增强 完全 
是 由 编译 器 完成 的 ，Java 虚 拟 机 没有 做 任何 调整 。 


以 int 类 型 为 例 ， 它 的 包 沁 类 是 
java.lang.Integer 。 它 提供 了 2 个 方法 来 名 助 编译 套 
在 int 变 量 和 Integer 对 象 之 间 转 换 : 角 仿 方法 value 

() 把 int 变 量 包 装 成 Integer 对 象 ， 实 例 方法 
intValue () 返回 被 包装 的 int 变 量 。 这 两 个 方法 的 
代码 如 下 : 


package java.lang; 
public final class Integer extends Number :implements 
Comparable<Integer> { 

// 其 他 代码 省 略 


private final int Value 
public static Integer Valueof(int i) { 
if (i >= IntegerCache.low && i <= IntegerCache.high) 
return IntegerCache.cache[i + (-IntegerCache.1ow)|]; 
return new Integer(i); 


} 
public int intValue() { 
return value; 


由 上 面 的 代码 可 知 ，IntegervalueOf () 方法 
并 不 是 每 次 都 创建 Integer () 对 象 ， 而 是 维护 了 
一 个 缓存 池 IntegerCache。 对 于 比较 小 (默认 是 - 
128~127) 的 int 变 量 ， 在 IntegerCache 初 始 化 时 就 
预先 加 载 到 了 池 中 ， 需 要 用 时 直接 从 池 里 取 即 
可 。IntegerCache 是 Integer 类 的 内 部 类 ， 为 了 便于 
参考 ， 下 面 给 出 它 的 完整 代码 。 


private static class IntegerCache { 
static final int low = -128; 
static final int high; 
static final Integer cache[l]; 


static { 
int h = 127; // high value may be configured by 
property 
String integerCacheHighPropValue = 


sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache. 


high"); 
if (integerCacheHighPropValue != null) { 
try 1 
int i = parseInt(integerCacheHighPropValue); 
i = Math.max(i, 127); 
// Maximum array size is Integer .MAX VALUE 
h = Math.min(i, Integer.MAX VALUE - (-low) -1); 
} catch( NumberFormatException nfe) { 
// If the property cannot be parsed into an int, 
ignore it. 
} 
} 
high = h; 


cache = new Integer[(high - low) + 1]; 
int j = low; 
for(int k = 0; k < cache.length; k++) 
cache[k] = new Integer (j++); 
// range [-128, 127] must be interned (JLS7 5.1.7) 
assert IntegerCache.high >= 127; 


private IntegerCache() {} 


具体 细节 就 不 解释 了 ， 说 明 的 是 
IntegerCache 在 初始 化 时 需要 确定 缓存 池 中 Integer 
对 象 的 上 限 值 ， 为 此 它 调用 了 sun.misc.VM 类 的 
getSavedProperty () 方法 。 要 想 让 VM 正确 初始 化 

需要 做 很 多 工作 ， 这 个 工作 推迟 到 第 11 划 进行 。 


这 里 先 用 一 个 hackitkVM.getSavedProperty () 方 
法 返回 非 null 值 ， 以 便 PntegerCache 可 以 正 币 初始 
化 。 


在 ch09native 目 录 下 创建 sun\misc 子 日 录 ， 在 
其 中 创建 VM.go 文 件 ， 然 后 在 VM.go 文 件 中 注册 
initialize () 方法 ， 代 码 如 下 : 


package misc 
import "jvmgo/cho9/instructions/base" 
import "jvmgo/ch09/native" 
import "jvmgo/cho9/rtda" 
import "jvmgo/cho9/rtda/heap" 
func init() { 
native.Register("sun/misc/VM", "initialize", "()V", 
initialize) 


} 


initialize () 方法 的 实现 如 下 : 


// private static native void initialize(); 
func initialize(frame *rtda.Frame) { 
vmClass := frame.Method().Cclass() 
savedProps := vmClass.GetRefVar("savedProps", 
"Ljava/util/Properties;") 
key := heap.JString(vmClass.Loader(), "foo") 
val := heap.JString(vmClass.Loader(), "bar") 


frame.OperandStack().PushRef (savedProps) 

frame.OperandStack( ).PushRef (key) 

frame.OperandStack( ) .PushRef (val) 

propsClass := 
vmClass.Loader().LoadClass("java/util/Properties") 

SetPropMethod := 
propsClass.GetIinstanceMethod("setProperty", 


(Ljava/lang/String;Ljava/lang/String;)Ljava/lang/Object;") 
base.InvokeMethod(frame, setPropMethod) 
} 


上 面 的 hack 代 码 可 能 有 些 不 好 理解 ， 但 翻 详 
成 等 价 的 Java 代 码 后 只 有 一 人 句 话 : 


private static native void initialize() { 
VM.savedProps.setProperty("foo", "bar") 
} 


最 后 ， 需 要 修改 invokenative.go， 在 其 中 导入 
misc 包 ， 改 动 如 下 : 


package reserved 

Import "jvmgo/cho9/instructions/Vbasey" 
import "jvmgo/cho9/rtda" 

import "jvmgo/ch09/native" 

import _ "jvmgo/cho9/native/java/lang" 
import _ "jvmgo/cho9/native/sun/misc" 


重新 编译 本 章 代码 ， 然 后 测试 下 面 的 Java 程 
序 


package jvmgo.book.cho9; 

import java.util.ArrayList; 

import java.util.List; 

public class BoxTest { 

public static void main(String[] args) { 
List<Integer> list = new ArrayList<>(); 
list.add(1); 
list.add(2); 
list.add(3); 
System.out.printin(1list.toSstring( )); 
for (int x : list) { 
System.out.println(x); 

} 


} 
} 


BoxTest 程 序 的 执行 结果 如 图 9-6 所 示 。 


命令 提示 符 一 口 其 
D:\go\workspace\bin>ch09, exe -Xire C:\Program Files\Java\irel, 8.0 .66”jvmgo, boo 四 
kk. ch09. BoxTest 
Ll i 
1 


图 9-6 ”BoxTest 程 序 执行 结 


9.8 本章 小 结 


本 章 主要 讨论 了 本 地 方法 调用 ， 以 及 Java 类 
库 中 一 些 最 基本 的 类 。 前 儿 革 基本 上 都 是 围绕 
Java 虚 拟 机 本 号 如 何 工作 而 展开 讨论 。 通 过 本 章 
的 学 习 ， 读 者 应 该 对 Java 虚 拟 机 和 Java 类 库 如 何 配 
合 工 作 有 了 初步 的 了 解 。 下 一 章 将 讨论 异常 处 
理 吉 


第 10 章 ” 异 各 处理 


寞 各 处 理 是 Java 语 言 非常 重要 的 一 个 语 读 ， 
本 章 从 Java 虚 拟 机 的 角度 来 讨论 异 间 是 如 何 被 抛 
出 和 处 理 鸭 。 开 始 本 章 之 前 ， 还 是 先 把 目录 结构 
准备 好 。 复 制 ch09 目 录 ， 改 名 为 ch10。 修 改 
main.go 等 文件 ， 把 import 语 句 中 的 ch09 全 都 蔡 换 
成 ch10。 本 章 对 目录 结构 没有 太 大 的 调整 。 


10.1 异常 处 理 概 壕 


在 Java 语 言 中 ， 有 异 各 可 以 分 为 两 类 : Checked 
异 钊 和 Unchecked 异 单 。Unchecked 弄 第 包括 
java.lang.RuntimeException 、 java.lang.Error 以 及 它 
们 的 子 类 ， 其 他 异 间 都 是 Checked 寞 单 。 所 有 有 寞 利 
都 最 终 继 承 目 java.lang.Throwable。 如 果 一 个 方法 
有 可 能 导 任 Checked 寞 和 常 抛 出 ， 则 该 方法 要 么 需要 
捕获 该 异 肖 并 妥 香 处理， 要义 必须 把 该 异 剃 列 在 
目 己 的 throws 子 句 中 ， 否 则 无 法 通过 编译 。 
Unchecked 寞 妾 没有 这 个 限制 。 请 注意 ，Java 虚 拟 
机 规 苑 并 没有 这 个 规定 ， 这 只 是 Java 语 言 的 语法 


规则 。 


异 利 可 以 由 Java 庶 拟 机 抛 出 ， 也 可 以 由 Java 代 
码 抛 出 。 当 Java 虚 拟 机 在 运行 过 程 中 过 到 比较 严 
重 的 问题 时 ， 会 抛 出 java.lang.Error 的 某 个 子 类 ， 
如 StackOverflowError、OutOfMemoryError 等 。 程 
序 一 般 无 法 从 这 种 寞 稍 里 恢复 ， 所 以 在 代码 中 通 
荫 也 不 必 关 心 这 类 弄 藤 。 一 部 分 指令 在 执行 过 程 

会 导致 Java 虐 拟 机 抛 出 

java.lang.RuntimeException 的 某 个子 类 ， 如 
NullPointerException 、 
IndexOutOfBoundsException 等 。 这 类 异常 一 般 是 
代码 中 的 pug 导 致 的 ， 需 要 格外 注意 。 在 代码 中 抛 
出 和 处 理 异 常 是 由 athrow 指 令 和 方法 的 异常 处 理 
表 配 合 完成 的 ， 本 草 将 重点 讨论 这 一 点 。 


在 Java 6 之 前 ，Oracle 的 Java 编 译 右 使 用 jsr、 
jsr_w 和 ret 指 令 来 实现 finally 子 句 。 从 Java 6 开始 ， 
已 经 不 再 使 用 这 些 指 令 ， 本 章 不 讨论 这 三 条 指 


令 。 


10.2 ”异常 抛 出 


在 Java 代 人 码 中 ， 异 背 症 通过 throw 关 键 字 抛 出 
的 。Java 虚 拟 机 规范 的 3.12 节 给 了 一 个 例子 ， 代 码 
如 下 : 


void cantBeZero(int i) { 
if (i == 0) { 
throw new TestExc(); 
} 
} 


上 面 的 方法 编译 之 后 ， 产 生 下 面 的 字 市 码 : 


0 iload 1 // 把 参数 


工人 


i) 推 入 操作 数 栈 顶 


1 ifne 12 // 如 果 


0， 直接 执行 


return 指 令 


4 new #2 // 创建 


TestExc 实 例 ， 把 引用 推 入 操作 数 栈 顶 


7 dup // 复制 


TestExc 实 例 引 用 


8 invokespecial #3 // 调用 


TestEXc 构 造 画 数 ( 栈 顶 引用 已 经 作为 参数 弹出 ) 


11 athrow // 抛 出 异常 


12 return // 方法 返回 


唯一 陌生 的 指令 是 athrow， 将 在 10.4 节 实现 该 
指令 。 从 字 太 码 来 看 ， 异 第 对 和 象 似乎 也 只 是 普通 
的 对 象 ， 通 过 new 指 令 创 建 ， 然 后 调用 构 志 函数 
进行 初始 化 。 这 十 真 鸭 吗 ? 如 采 碍 看 
java.lang.Exception 或 RuntimeException 的 源 代 人 码 整 
可 以 知道 ， 这 并 不 是 真 的 。 它 们 的 构造 罚 数 都 调 


用 了 超 类 java.lang.Throwable 的 构造 画 数 。 
Throwable 的 构造 国 数 又 调用 了 fillInStackTrace 

() 方法 记录 Java 虚 拟 机 栈 信 息 ， 这 个 方法 的 代 
码 如 下 : 


// java.lang.Throwable 
public synchronized Throwable fillInStackTrace() { 
if (stackTrace != null || 
backtrace != null /* Out of protocol state */ ) { 
fillIinstackTrace(0); 
stackTrace = UNASSIGNED_ STACK; 


return this,; 


fillInStackTrace () 是 用 Java 写 的 ， 必 须 借助 
男 外 一 个 本 地 方法 才能 访问 Java 虚 拟 机 栈 ， 这 个 
方法 就 是 重 载 后 的 flInStackTrace (int) 方法 ， 代 
码 如 下 : 


private native Throwable fillIinSstackTrace(int dummy ) 


也 就 是 说 ， 要 想 抛 出 异常 ，Java 虚 拟 机 必须 
实现 这 个 本 地 方法 。 在 10.5 节 中 ， 我 们 会 真正 实 
现 这 个 方法 ， 这 里 先 给 它 一 个 空 的 实现 。 在 
ch10native\java\lang 目 隶 下 创建 Throwable.go 文 
件 ， 在 其 中 注册 fillInStackTrace (int) 方法 ， 代 码 
如 下 : 


package lang 
import "jvmgo/ch1i0/native" 
import "jvmgo/ch1i0/rtda" 
import "jvmgo/ch1i0/rtda/heap" 
func init() { 

native.Register("java/lang/Throwable", 
"fillIinSstackTrace", 

"(I)Ljava/lang/Throwable;", fillIinSstackTrace) 

} 
// private native Throwable fillIinSstackTrace(int dummy ); 
func fillIinstackTrace(frame *rtda.Frame) { 

// 在 


10 .5 节 实 现 


10.3 ”异常 处 理 表 


异常 处 理 是 通过 try-catch 颁 实现 的 ， 还 是 参考 
Java 庶 拟 机 规范 的 3.12 太 ， 里 面 有 一 个 例子 ， 代 码 
如 下 : 


void catchone() { 
try { 
tryItOut( ); 
} catch (TestExc e) { 
handleExc(e); 


上 面 的 方法 编 详 之 后 ， 产 生 下 面 的 季节 但 : 


1 aload 0 // 把 局 部 变量 


0 \ 


this) 推 入 操作 数 栈 顶 


2 jinvokevirtual #4 // 调用 


tryItOut( ) 方 法 


4 goto 13 // 如 果 


try{f} 没 有 抛 出 异常 ， 直 接 执行 


return 指 令 

7 astore 1 // 否则 ， 异 常 对 象 引 用 在 操作 数 栈 顶 ， 把 它 弹 出 ， 并 放 入 
局 部 变量 

1 

8 aload 0 // 把 


this 推 入 栈 顶 (将 作为 


handleExc( ) 方 法 的 参数 


0) 


9 aload 1 // 把 异常 对 象 引 用 推 入 栈 顶 (将 作为 
handleExc( ) 方 法 的 参数 


1) 


10 invokevirtual #5 // 调用 


handleExc( ) 方 法 


13 return // 方法 返回 


从 字 世 人 码 来 看 ， 如 条 没有 异 间 抛 出 ， 则 会 直 
接 goto 到 retum 指 令 ， 方 法 正 各 返回 。 那 么 如 采 有 


异 贡 抛 出 ，goto 和 return 之 间 的 指令 是 如 何 执行 的 
呢 ? 答案 息 查 找 方法 的 异 帅 处 理 表 。 异 各 处 理 表 
征 Code 属 性 的 一 部 分 ， 它 记录 了 方法 是 否 有 能 力 
处 理 某 种 异 弟 。 回 顾 一 下 方法 的 Code 属 性 ， 它 的 
结构 如 下 : 


Code_attribute { 
U2 attribute_name_index ， 
u4 attribute_length ; 
U2 max_stack; 
U2 max_locals; 
u4 code_length; 
u1 code[code_ length]; 
U2 exception_table_ length; 
{ U2 start_pc; 
U2 end_pc; 
u2 handler_pc; 
U2 catch_type; 
} exception_table[exception _ table _ length]; 
U2 attributes count,; 
attribute_info attributes[attributes_ count]; 


异常 处 理 表 的 每 一 项 都 包含 3 个 信息 : 处 理 哪 
部 分 代码 抛 出 的 异常 、 哪 类 异常 ， 以 及 异常 处 理 
代码 在 哪里 。 有 具体 来 说 ，start_pc 和 end_pc 可 以 锁 


定 一 部 分 字 市 码 ， 这 部 分 字 市 码 对 应 某 个 可 能 抛 
出 异常 的 try{f} 代 码 块 。catch_type 是 个 索引 ， 通 过 
它 可 以 从 运行 时 常量 池 中 查 到 一 个 类 符号 引用 ， 
解析 后 的 类 是 个 异常 类 ， 假 定 这 个 类 是 X。 如 果 位 
于 start_pc 和 和 end_pc 之 间 的 指令 抛 出 异 肖 x， 且 x 是 X 

(或 者 X 的 子 类 ) 的 实例 ，handler_pc 就 指出 负责 
异常 处 理 的 catch{} 块 在 哪里 。 


回 到 catchOne () 方法 ， 它 的 异常 处 理 表 只 
如 下 一 项 : 


当 tryItOut () 方法 通过 athrow 指 令 抛 出 
TestExc 异 常 时 ，Java 庶 拟 机 首先 会 查找 tryItOut 
() 方法 的 异常 处 理 表 ， 看 它 能 否 处 理 该 异常 。 
如 果 能 ， 则 跳 转 到 相应 的 字 节 码 开始 异常 处 理 。 


假设 tryItOut () 方法 无 法 处 理 异 常 ，Java 虚 拟 机 
会 进一步 查看 它 的 调用 者 ， 也 束 是 catchOne () 方 
法 的 异常 处 理 表 。catchOne () 方法 刚好 可 以 处 理 
TestExc 异 第 ， 便 catch{} 块 得 以 执行 。 


假设 catchOne () 方法 也 无 法 处 理 TestExc 异 
常 ，Java 虚 拟 机 会 继续 查找 catchOne () 的 调用 者 
的 异常 处 理 表 。 这 个 过 程 会 一 直 继 续 下 去 ， 和 直人 到 
找到 某 个 异 肖 处 理 项 ， 或 者 到 达 Java 虚 拟 机 栈 的 压 
部 。 把 这 部 分 逻辑 放 在 athrow 指 令 中 ， 具 体 请 看 
10.4 小 节 。 下 面 修改 Method 结 构 体 ， 在 里 面 增加 
寞 季 处 理 表 。 


打开 ch10Ntdavheap\method.go 文 件 ， 给 Method 
结构 体 添 加 exceptionTable 字 段 ， 代 码 如 下 : 


type Method struct { 
,,，// 其 他 字段 


exceptionTable ExceptionTable 


然后 修改 copyAttributes () 方法 ， 从 Code 属 
性 中 复制 异常 处 理 表 ， 代 人 码 如 下 : 


func (self *Method) copyAttributes(cfMethod 
*classfile.MemberInfo) { 
if codeAttr := cfMethod.CodeAttribute(); codeAttr != nil { 
，// 其 他 字段 


self.exceptionTable = 
NewExceptionTable(codeAttr .ExceptionTable( ), 
self.class.constantPool) 
} 


} 


稍 后 再 介绍 ExceptionTable 类 型 和 
newExceptionTable () 画 数 。 继 续 编 辑 method.go 
文件 ， 给 Method 结 构 体 添加 FindExceptionHandler 

() 方法 ， 代 码 如 下 : 
func (self *Method) FindExceptionHandJler(exClass *Class, pc 


int) int { 
handler := 


self.exceptionTable.findExceptionHandler (exClass, pc) 
If handler != nil { 
return handler.handlerPpc 


return -1 


FindExceptionHandler () 方法 调用 
ExceptionTable.findExceptionHandler () 方法 搜索 
异 币 处 理 表 ， 如 采 能 够 找到 对 应 的 寞 第 处 理 项 ， 
则 返回 它 的 handlerPc 字 段 ， 人 否则 返回 -1。Method 
结构 体 修 改 完毕 ， 下 面 来 看 ExceptionTable 。 


在 ch10\rtda\heap 目 隶 下 创建 exception_table.go 
文件 ， 在 其 中 定义 ExceptionTable 类 型 ， 代 码 如 
下 : 


package heap 
import "jvmgo/chi0/classfile" 
type ExceptionTable [1]*ExceptionHandler 


ExceptionTable 只 是 []*ExceptionHandler 的 别名 
而 已 ，ExceptionHandler 的 定义 如 下 : 


type ExceptionHandler struct { 


StartPc int 
endPc int 
handlerPpc int 
catchType *ClassRef 


这 4 个 字段 在 前 面 已 经 介绍 过 ， 这 里 不 多 解 
释 。 继 续 编 辑 exception_table.go 文 件 ， 在 其 中 实现 
newExceptionTable () 函数 ， 代 码 如 下 : 


func newExceptionTable(entries 
[]*classfile.ExceptionTableEntry, 
cp *ConstantPool) ExceptionTable { 


table := make([]*ExceptionHandler, len(entries)) 
for i, entry := range entries { 
table[i] = &ExceptionHandlert{ 
startPc: int(entry.StartPc( ) )， 
endPc : Int(entry,.EndPc( ) )， 
handlerpPc : int(entry.HandlerPc()), 
catchType: getCatchType(uint(entry,CatchType() )， 
cp), 
} 


return table 


newExceptionTable () 函数 把 class 文 件 中 的 
异常 处 理 表 转换 成 ExceptionTable 类 型 。 有 一 点 需 
要 特别 说 明 : 异常 处 理 项 的 catchType 有 可 能 是 0 。 
我 们 知道 0 是 无 效 的 和 常量 池 和 索引， 但 是 在 这 里 0 并 
韭 表示 catch-none， 而 是 表示 catch-all， 它 的 用 法 
马上 就 会 看 到 。getCatchType () 玉 数 从 运行 时 和 营 
量 池 中 查找 类 符号 引用 ， 代 码 如 下 : 

func getCatchType(index uint, cp *ConstantPool) *ClassRef { 


if index == 0 { 
return nil 


return cp.GetConstant(index).(*ClassRef) 


继续 编辑 exception_table.go 文 件 ， 实 现 
findExceptionHandler () 方法 ， 代 码 如 下 : 


func (self ExceptionTable) findExceptionHandler (exClass 
*Class, 
pc int) *ExceptionHandler { 
for _, handler := range self { 
If pc >= handler,startPc && pc < handler.endpc { 


if handler.catchType == nil { 
return handler // catch-all 


} 
catchClass := handler.catchType.ResolvedClass() 
If catchClass == exClass || 
catchcClass.IsSuperCclassof(exClass) { 
return handler 
} 
} 


return nil 


前 处 理 表 查找 逻辑 前 面 已 经 折 述 过 ， 此 处 
两 点 。 第 一 ，startPc 给 出 的 是 
try{} 语 句 块 的 第 一 条 指令 ，endPc 给 出 的 则 是 try{} 
语句 块 的 下 一 条 指令 。 第 二 ， 如 有 果 catchType 古 nil 
(在 class 文 件 中 是 0) ， 表 示 可 以 处 理 所 有 异常 ， 
这 是 用 来 实现 finally 子 句 的 。 


为 了 廊 约 篇 幅 ， 本 革 束 不 再 讨论 多 个 catch 
块 、 骸 僚 try-catch， 以 及 finally 子 句 等 对 应 的 字 廊 
但 实现 了 ， 读 着 可 以 阅读 Java 庶 拟 机 规 苑 的 3.12 


广 。 下 一 廊 将 实现 athrow 指 令 。 


10.4 实现 athrow 指 令 


athrow 属 于 3 引用 类 指令 ， 在 
ch10\instructionsNeferences 目 孙 下 创建 athrow.go 文 
件 ， 在 其 中 定义 athrow 指 令 ， 代 码 如 下 : 


package references 

import "reflect" 

import "jvmgo/ch10/instructions/base" 

import "jvmgo/ch1i0/rtda" 

import "jvmgo/ch1i0/rtda/heap" 

// Throw exception or error 

type ATHROW struct{ base.NoOperandsInstruction } 


athrow 指 令 的 哥 作 数 是 一 个 异 间 对 象 引用 ， 
从 操作 数 栈 弹出 。Execute () 方法 的 代码 如 下 : 


func (self *ATHROW) Execute(frame *rtda.Frame) { 
ex := frame.OperandStack().PopRef() 
If ex == nil { 
panic("java.lang.NullPointerException") 


thread := frame.Thread () 
if !findAndGotoExceptionHandler(thread, ex) { 
handleUncaughtException(thread, ex) 


移 从 操作 数 栈 中 弹出 异 利 对 象 引 用 ， 如 采访 
引用 是 null， 则 抛 出 NullPointerException 异 常 ， 奋 
则 看 是 否 可 以 找到 并 跳 转 到 异 津 处 理 代码 。 
findAndGotoExceptionHandler () 函数 的 代码 如 
区 


func findAndGotoExceptionHandler(thread *rtda.Thread, ex 
*heap.0Object) bool { 
for { 


frame := thread.CurrentFrame() 
pc := frame.NextPC() - 1 
handlerPC := 


frame.Method().FindExceptionHandler(ex.Class(), pc) 
If handlerPC >0f 
stack := frame.Operandstack() 
stack.clear() 
stack.PushRef (ex) 
frame.SetNextPC(handlerPCc) 
return true 


} 

thread.PopFrame( ) 

If thread.ISStackEmpty() { 
break 


} 


return false 


从 当前 帧 开始 ， 所 历 Java 虚 拟 机 栈 ， 查 找 方 
法 的 异 音 处理 表 。 假 设 届 历 到 帧 F， 如 条 在 FE 对 应 
的 方法 中 找 不 到 腊 弟 处 理 项 ， 则 把 F 弹 出 ， 继 续 远 
历 。 有 反之 如 末 找 到了 异 第 处 理 项 ， 在 跳 轩 到 异常 
处 理 代码 之 前 ， 要 先 把 F 的 操作 数 栈 消 空 ， 然 后 把 
异 稼 对 象 引用 推 入 栈 硕 。OperandStack 结 构 体 的 
Clear () 方法 是 新 增加 的 ， 后 面 给 出 它 的 代码 。 


如 末 遇 有 历 完 Java 虚 拟 机 栈 还 是 找 不 到 异 利 处 
理 代 码 ， 则 handleUncaughtException () 函数 打 
印 出 Java 虚 拟 机 栈 信息 ， 代 码 如 下 : 


func handleUncaughtException(thread *rtda.Thread, ex 
*heap.Object) { 

thread.ClearStack() 

JMsg := ex.GetRefVar("detailMessage", 
"Ljava/lang/String;") 

goMsg := heap.GoString(jMsg) 

println(ex.Class().JavaName() + "”: " + goMsg) 

stes := reflect,Valueof(ex.EXxtral( ) ) 

for i := 0; i < stes.Len(); i++ { 

ste := stes.Index(i).Interface().(interface { 
String() string 


}) 
printjn("\tat " + ste.String()) 


handleUncaughtException () 函数 把 Java 虚 拟 
机 栈 清空 ， 然 后 打印 出 异常 信息 。 由 于 Java 虚 拟 
机 栈 已 经 宝 了 ， 所 以 解释 囊 也 束 终 止 执行 了 。 上 
面 的 代码 使 用 Go 语言 的 reflect 包 打印 Java 虚 拟 机 栈 
音 已 。 可 以 猜 到 ， 腊 常 对 象 的 extra 字 段 中 存放 的 
驶 是 Java 庶 拟 机 栈 信息 ， 那 么 这 个 extra 字 段 是 什 
么 时 候 设置 的 昵 ?10.5 市 会 揭晓 答案 。 前 面 的 代 
码 中 还 有 几 个 方法 没有 介绍 ， 现 在 依次 给 出 它们 
的 代码 。 


OperandStack 结 构 体 的 Clear () 方法 如 下 : 


func (self *OperandStack) Clear() { 
self.size = 0 
for i := range self.slots { 
self.slots[il].ref = nil 


Thread 结 构 体 的 ClearStack () 方法 如 下 : 


func (self *Thread) ClearStack() { 
self.stack.clear() 


} 


它 调用 了 Stack 结 构 体 的 dear () 方法 ， 代 码 
如 下 : 


func (self *Stack) clear() { 
for !self.isEmpty() { 
self .pop() 


athrow 指 令 实现 后 ， 还 需要 修改 
ee 在 NewInstruction 
() 画 数 中 增加 athrow 指 令 的 case 语 句 ， 为 了 节约 
篇 幅 这 里 束 不 给 出 代码 了 。 


10.5 Java 虚拟 机 栈 信息 


回 人 到 chl0\native\java\lang\Throwable.go 文 件 ， 
在 其 中 定义 StackTraceElement 结 构 体 ， 代 码 如 
下 : 


type StackTraceElement struct { 


fileName string 
className string 
methodName string 
lineNumber int 


. 


StackTraceElement 结 构 体 用 来 记录 Java 庶 拟 
机 栈 帧 信息 : lineNumber 字 段 给 出 帧 正在 执行 哪 
行 代码 ;methodName 字 上 段 给 出 方法 名 : 
className 字 段 给 出 声明 方法 的 类 名 ; 和 eName 字 
段 给 出 类 所 在 的 文件 名 。 下 面 实现 


java.lang.Throwable 的 fillInStackTrace () 本 地 方 
法 ， 代 码 如 下 : 


// private native Throwable fillIinSstackTrace(int dummy ); 
func fillIinSstackTrace(frame *rtda.Frame) { 
this := frame.LocalVars().GetThis!() 
frame.OperandSstack().PushrRef(this) 
stes := createStackTraceElements(this, frame.Thread()) 
this.SetExtra(stes) 


重点 在 createStackTraceElements () 函数 
里 ， 代 码 如 下 : 


func createStackTraceElements(t0bj *heap.Oobject, thread 
*rtda.Thread) 
[]j*StackTraceElement { 
skip := distanceToObject(t0Obj.Class()) + 2 


frames := thread.GetFrames()[skip:] 
stes := make([]*StackTraceElement, len(frames)) 
for i, frame := range frames { 


stes[i] = createStackTraceElement(franme) 


3 


return stes 


这 个 函数 需要 解释 一 下 。 由 于 栈 顶 两 帧 正在 
执行 fillInStackTrace (int) 和 fillInStackTrace () 
方法 ， 所 以 需要 跳 过 这 两 帧 。 这 两 帜 下 面 的 几 帧 
正在 执行 异常 类 的 构造 画 数 ， 所 以 也 要 跳 过 ， 具 
体 要 跳 过 多 少 巾 数 则 要 看 异 肖 类 的 继承 层次 。 
distanceToObject () 画 数 计算 所 需 跳 过 的 帧 数 ， 
代码 如 下 : 


func distanceToObject(class *heap.Class) int { 

distance := 0 

for c := class.SuperClass(); c != nil; c = c.SuperClass() 
{ 


distance+t+ 


return distance 


计算 好 需要 跳 过 的 帧 之 后 ， 调 用 Thread 结 构 
体 的 GetFrames () 方法 拿 到 完整 的 Java 虚 拟 机 
栈 ， 然 后 reslice 一 下 就 是 真正 需要 的 帆 。 


GetFrames () 方法 只 是 调用 了 Stack 结 构 体 的 
getFrames () 方法 ， 代 码 如 下 : 


func (self *Thread) GetFrames() []*Frame { 
return self.stack.getFrames() 


上 


下 面 是 getFrames () 方法 的 代码 。 


func (self *Stack) getFrames() []*Frame { 
frames := make([]*Frame, 0, self.size) 
for frame := self,. top; frame != nil; frame = frame.lower 


{ 


frames = append(frames, franme) 


return frames 


} 


createStackTraceElement () 函数 根据 帧 创建 
StackTraceElement 实 例 ， 代 人 码 如 下 : 


func createStackTraceElement(frame *rtda.Frame) 
*StackTraceElement { 
method := frame.Method() 
class := method.Class() 
return &StackTraceElement{ 
fileName: class.SourceFile(), 
className: class.JavaName(), 


methodName: method ,Name( )， 
lineNumber: method.GetLineNumber(frame.NextPC() - 1), 
} 
} 


最 后 实现 Class 结 构 体 的 SourceFile () 方法 和 
Method 结 构 体 的 GetLineNumber () 方法 。 打 开 
class.go， 给 Class 结 构 体 添加 sourceFile 字 段 ， 代 码 
如 下 : 


type Class struct { 
,,，，// 其 他 字段 


sourceFile string 


SourceFile () 是 getter 方 法 ， 这 里 就 不 给 
代码 了 。 接 下 来 需要 修改 newClass () 函数 ， 从 
class 文 件 中 读 取 源 文件 名 ， 改 动 如 下 : 


func newClass(cf *classfile.ClassFile) *Class { 
class := &Classt{} 
,，， // 其 他 代码 


class.sourceFile = getSourceFile(cf) 
return class 


} 


在 3.4.3 广 讨论 过 ， 源 文件 名 在 ClassFile 结 构 
的 属性 表 中 ，getSourceFile () 函数 提取 这 个 信 
息 ， 代 码 如 下 : 


func getSourceFile(cf *classfile.ClassFile) string { 
if sfAttr := cf.SourceFileAttribute(); sfAttr != nil { 
return sfAttr.FileName() 


return "Unknown" 


} 


主意 ， 并 不 是 每 个 class 文 件 中 都 有 源 文件 信 
已， 这 个 因 编译 时 的 编译 器 选项 而 异 。Class 结 构 
体 改 完了 ， 下 面 修改 Method 结 构 体 。 打 开 
method.go， 给 Method 结 构 体 添加 lineNumberTable 
字段 ， 改 动 如 下 : 


type Method struct { 
，// 其 他 字段 


lineNumberTabjle *cljlassfile.LineNumberTableAttribute 


然后 修改 copyAttributes () 方法 ， 从 class 文 
件 中 提取 行 号 表 ， 代 码 如 下 : 


func (self *Method) copyAttributes(cfMethod 
*classfile.MemberIinfo) { 
if codeAttr := cfMethod.CodeAttribute(); codeAttr '!= nil 
{ 
self.maxStack = codeAttr.MaxStack() 
self.maxLocals = codeAttr.MaxLocals() 
self.code = codeAttr.cCodel() 
self.lineNumberTable = 
codeAttr.LineNumberTableAttribute() 
self.exceptionTable = 
newExceptionTable(codeAttr .ExceptionTable(), 
self.class.constantPool) 


} 


最 后 添加 GetLineNumber () 方法 ， 代 码 如 
下 : 


func (self *Method) GetLineNumber(pc int) int { 
If self,.IsNative() { 
return -2 


} 
if self.lineNumberTable == nil { 
return -1 


return self.lineNumberTable.GetLineNumber(pc) 


和 源 文 件 名 一 样 ， 并 不 是 每 个 方法 都 有 行 号 
表 。 如 采 方 法 没有 行 号 表 ， 目 然 也 驶 得 不 到 pc 对 
应 的 行 号 ， 这 种 情况 下 返回 -1。 本 地 方法 没有 字 
节 码 ， 这 种 情况 下 返回 -2。 剩 下 的 情况 调用 
LineNumberTableAttribute 结 构 体 的 GetLineNumber 
() 方法 查找 行 号 ， 代 码 如 下 : 


func (self *LineNumberTableAttribute) GetLineNumber(pc int) 
int { 
for i := len(self.lineNumberTable) - 1; i >= 0; i-- { 
entry := self.lineNumberTable[i] 
if pc >= int(entry.startPpc) { 
return int(entry.1lineNumber) 


return -1 


上 上面 的 代码 在 
classfilevattr_line_number_table.go 文 件 中 ， 行 号 表 


的 更 多 信息 请 参考 3.4.7T。 


10.6 测试 本 章 代 码 


打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 草 
代码 。 


go install jvmgo\ch10 


命令 执行 完毕 后 ， 在 D:，\govworkspace\bin 目 
了 永 下 出 现 ch10.exe 文 件 。 运 行 ch10.exe， 测 试 下 面 
的 Java 程 序 。 


package jvmgo.book.ch10 ， 
public class ParseIntTest { 
public static void main(String[] args) { 
foo(args); 


private static void foo(String[] args) { 
try { 
bar (args); 
} catch (NumberFormatException e) { 
System.out.println(e.getMessage()); 
} 


} 
private static void bar(String[] args) { 
if (args.length == 0) { 
throw new IndexOutOfBoundsException("no args!"); 


} 
int x = Integer.parseInt(args[0]); 
System.out.println(x); 


笔者 使 用 不 同 的 
1 所 示 。 


Sh 


数 进 行 测 试 ， 结 末 如 图 10- 


令 提示 符 


D:\go\workspace\bin>chl10. exe -Xijre “C:\Program Files\Java\ijrel. 8.0 .66” jyvmgo. bool 
k. chl0. ParselntTest 123 


D:\go\workspace\bin>ch10,. exe -Xire “C:\Program Files\Java\ijrel. 8.0 66” ijvmgo. boo 
k. chl0. ParselntTest abc 
For input string: “abc” 


D:\go\workspace\bin>chl10. exe -Xjre “C:\Program Files\Java\ijrel.®8.0 66” ijvmgo. boo 
k. ch10. ParselntTest 


java. lang. IndexOutOfBoundsException: no args! 
at jvmgo. book,. chl0, ParselIntTest. bar (ParselIntTest. java:19) 
at jvmgo. book. ch10. ParseIntTest. foo(ParselIntTest. java:11) 
at jvymgo. book. ch10.ParseIntTest. main(ParselntTest. java:6) 


D:\go\workspace\bin> 


赂 10-1 ParseIntTest 程 序 测试 结 


10.7 本 章 小 结 


本 章 讨 论 了 异常 抛 出 和 人 处理、 异常 处 理 表 、 
athrow 指 令 等 ， 下 一 章 将 讨论 类 加 载 右 。 


第 11 章 ”结束 


在 第 7 草 讨论 了 方法 调用 和 返回 ， 在 第 8 章 讨 
论 了 数组 和 字符 串 。 经 过 整整 8 章 的 努力 之 
后 ,“Hello，World! ”终于 出 现在 了 控制 台 上 。 
不 过 比较 遗憾 的 是 ， 由 于 java.lang.System 类 还 没 
有 被 正确 初始 化 ， 直 接 调用 System.out.println () 
方法 会 导 仅 NullPointerException 异 常 抛 出 。 为 此 
修改 了 invokevirtual 指 令 ， 对 println () 方法 做 了 
符 殊 人 处理。 本 革 将 弥 付 这 个 遗憾 ， 把 这 个 hack 从 
代码 中 删除 ， 让 Java 虚 拟 机 可 以 真正 在 控制 台 上 
打印 数字 和 字符 绅 。 


本 草 也 是 本 书 的 最 后 一 革 ， 在 结尾 会 对 全 书 
内 容 进 行 简 要 回顾 。 开 始 本 章 之 前 ， 还 是 


录 结 构 准 备 好 。 复 制 ch10 目 录 ， 改 名 为 ch11。 修 
改 main.go 等 文件 ， 把 import 语 句 中 的 ch10 全 都 替 
换 成 ch11。 本章 对 目录 结构 没有 太 大 的 调整 。 


11.1 System 类 是 如 何 修 初始 化 的 


大 家 都 知道 ，System 类 有 3 个 公开 的 静态 常 
量 : out、err 和 in。 其 中 out 和 err 用 于 向 标准 输出 流 
和 标准 错误 流 中 写 入 信息 ，in 用 于 从 标准 输入 流 
中 读 取 人 信息。 那么 这 3 个 帝 量 是 在 哪里 被 赋值 的 
呢 ? 看 一 下 System 类 的 源 代 码 : 


// java.lang.System 
public final class System { 
public final static InputStream in = null; 
public final static PrintStream out = null; 
public final static PrintStream err = null; 
/* register the natives via the static initializer. 
* 


* VM will invoke the initializeSystemClass method to 


complete 

* the initialization for this class separated from 
clinit. 

* Note that to use properties set by the VM, see the 
constraints 


* described in the initializeSystemClass method. 
WA 
private static native void registerNatives(); 
static { 
registerNatives(); 


} 
，// 其 他 代码 


从 注释 可 知 ，System 类 的 初始 化 过 程 分 为 两 
个 阶段 。 第 一 个 阶段 由 类 初始 化 方法 完成 ， 在 这 
个 方法 中 registerNatives () 方法 会 注册 其 他 本 地 
方法 。 第 二 个 阶段 由 VM 完成 ， 在 这 个 阶段 VM 会 
调用 System.initializeSystemClass () 方法 。 那 么 
initializeSystemClass () 方法 究竟 干 了 些 什么 
呢 ? 这 个 方法 很 长 ， 而 且 有 很 详细 的 注释 。 去 挥 
与 本 节 讨 论 无 关 的 代码 和 注释 之 后 ， 它 的 代码 如 
下 : 


As 


* Initialize the System class. Called after thread 
initialization. 

*/ 
private static void initializeSystemClass() { 


，// 其 他 代码 


FileInputStream fdIn = new 
FileInputStream(FileDescriptor .in); 
FileOutputStream fdout = new 


FileOutputStream(FileDescriptor.out); 
FileOutputStream fdErr = new 

FileOutputStream(FileDescriptor.err); 
SetIno(new BufferedInputStream(fdIn ) ) ， 
setOuto(newPrintStream(fdOut, 

props.getProperty("sun.stdout.encoding"))); 
setErro(newPrintStream(fdErr, 

props.getProperty("sun.stderr.encoding"))); 

，// 其 他 代码 


可 见 in、out 和 err 正 是 在 这 里 设置 的 。 再 来 看 
sun.misc.VM 类 的 源 代码 (VM 类 属于 Oracle 私 有 
代码 ， 并 没有 开源 ， 下 面 是 反 编 译 后 的 Java 代 
码 ) 


// Sun.misc.VM 
public class VM { 
，// 其 他 代码 


static { 
，// 其 他 代码 


initialize( ); 
} 


private static native void initialize(); 


) 


VM 类 在 初始 化 时 调用 了 initialize () 方法 。 
虽然 initialize () 是 本 地 方法 ， 但 是 可 以 推测 正 是 
这 个 方法 调用 了 System.initializeSystemClass () 
方法 。 十 否 真 的 是 这 样 笔 者 承 不 做 考证 了 了， 下面 
修改 解释 器 ， 让 System 类 可 以 正确 初始 化 。 


11.2 ”初始 化 System 类 


元 打开 
chll\instructions\references\invokevirtual.go 文 件 ， 
修改 invokevirtual 指 令 的 Execute () 方法 ， 把 其 中 
的 hack 代 码 删 挥 。 由 于 只 是 删除 代码 ， 这 里 束 不 
做 详细 说 明了 。 


接 下 来 打开 chllmnative\sunmiscCAVM.go 文 
件 ， 删 除 heap 包 的 导入 语句 。 原 来 的 initialize () 
方法 也 是 用 hack 方 式 实现 的 ， 需 要 重 写 ， 代 码 如 
下 : 


// private static native void initialize(); 

func initialize(frame *rtda.Frame) { 
classLoader := frame.Method().Cclass().Loader() 
JlSysClass := classLoader.LoadClass("java/lang/System") 
initSysClass := 

JlSysClass.GetStaticMethod("initializeSystemClass", "()V") 


base.InvokeMethod(frame, initSysClass) 


} 


新 的 实现 只 是 调用 了 
System.initializeSystemClass () 方法 而 已 。 下 面 
修改 解释 器 ， 让 它 在 执行 主 类 的 main () 方法 之 
前 先 调用 VM.initialize () 方法 。 为 了 让 代码 的 可 
读 性 更 好 ， 将 对 main.go 文 件 进行 比较 大 的 调整 。 
打开 chll\main.go， 把 下 面 的 代码 复制 进去 : 


package main 
func main() { 
cmd := parsecmd() 
If cmd.versionFlag { 
println("version 0.0.1") 
} else if cmd.helpFlag || cmd.class == "" { 
printUsage() 
} else { 
newJVM(cmd).start() 


主要 逻辑 都 被 挪 到 了 (新 增 加 的 ) 
chll\jvm.go 文 件 中 ， 代 码 如 下 : 


package main 

import "fmt" 

import "strings" 

import "jvmgo/chii/classpath" 

import "jvmgo/ch1i1i/instructions/base" 
import "jvmgo/ch1i1i/rtda" 

import "jvmgo/ch1ii/rtda/heap" 

type JVM struct { 


cmd *Cmd 
classLoader *heap.ClassLoader 
mainThread *rtda.Thread 


} 
func newJVM(cmd *Cmd) *JVM {...} 
func (self *JVM) start() {...} 


newJVM () 男 数 创建 JVM 结 构 体 实例 ， 代 
人 码 如 下 : 


func newJVM(cmd *Cmd) *JVM { 
cp := classpath.Parse(cmd.XjreOption, cmd.cpOption) 
classLoader := heap.NewClassLoader(cp, 
cmd.verboseClassFlag) 
return &JVM{ 
cmd: cmd, 
classLoader: classLoader, 
mainThread: rtda.NewThread(), 


start () 方法 先 初 始 化 YM 类 ， 然 后 执行 主 类 
的 main () 方法 ， 代 码 如 下 : 


func (self *JVM) Start() { 
self.initVM() 
self .execMain() 


initVM () 先 加 载 sun.mis.VM 类 ， 人 然后 执行 
其 类 初始 化 方法 ， 代 码 如 下 : 


func (self *JVM) initVM() { 
vmClass := self.classLoader.LoadClass("sun/misc/VM") 
base.InitClass(self.mainThread, vmClass) 
interpret(self.mainThread, self.cmd.verboseInstFlag) 


execMain () 方法 先 加 载 主 类 ， 然 后 执行 其 
main () 方法 ， 代 码 如 下 : 


func (self *JVM) execMain() { 


className := strings.Replace(self.cmd.class, "~.", "/", 
-1) 

mainClass := self.classLoader.LoadClass(className) 

mainMethod := mainClass.GetMainMethod() 

if mainMethod == nil { 


fmt.Printf("Main method not found in class %s\n", 
self.cmd.class) 


return 
} 
argsArr := self.createArgsArray() 
frame := Self,mainThread,NewFrame(mainMethod ) 


frame.LocalVars().SetRef(0, argsArr) // 给 


main( ) 方 法 传递 


args 参 数 


self .mainThread.PushFrame(franme) 
interpret(self.mainThread, self.cmd.verboseInstFlag) 


execMain () 方法 的 前 半 部 分 代码 是 从 
main.go 文 件 中 找 贝 过 来 的 ， 我 们 已 经 比较 熟悉 
了 。 后 半 部 分 代码 需要 解释 的 一 点 是 在 调用 
main () 方法 之 前 ， 需 要 给 它 传递 args 参 数 ， 这 
尽 通过 直接 操作 局 部 变量 表 实 现 的 。 
createArgsArray () 方法 把 Go 的 []string 变 量 转 换 
成 Java 的 字符 串 数 组 ， 代 码 是 从 interpreter.go 文 件 
中 找 贝 过 来 的 ， 如 下 所 示 : 


func (self *JVM) createArgsArray() *heap.Object { 
stringClass := 

self.classLoader .LoadClass("java/lang/String") 
argsLen := uint(len(self.cmd.args)) 
argsArr := stringClass.ArrayClass().NewArray(argsLen) 
JArgs := argsArr.Refs() 
for i, arg := range self.cmd.args { 


JArgs[i] = heap.JString(self.classLoader, arg) 


return argsArr 


} 


jvm.go 文 件 改 好 了 ， 下 面 修改 interpret () 男 
数 。 打 开 chll\interpreter.go， ee 
名 和 createArgsArray () 函数 ， 然 后 修改 interpret 
WU 画 数 ， 代 码 如 下 : 


func interpret(thread *rtda.Thread, logInst bool) { 
defer catchErr(thread) 
loop(thread, logInst) 

} 


修改 之 后 interpret () 函数 和 价 单 了 许多 ， 直 接 
调用 loop () 函数 进入 循环 即 可 。 至 此 ， 解 释 器 
修改 完毕 。 这 束 古 本 划 要 写 的 全 部 代码 吗 ? 并 不 
是 。 为 了 正常 执行 System.initializeSystemClass 

() 以 及 System.out.printn () 等 方法 ， 还 需要 实 
现 很 多 Java 类 库 中 的 本 地 方法 。 为 了 刷 约 篇 幅 ， 


这 里 丈 不 一 一 列举 了 ， 请 读者 阅读 随 书 源 代 码 。 
下 面 以 System.out.printtn (String) 为 例 解释 字符 
PR 是 . 


串 是 如 何 被 打印 到 控制 台 的 ， 其 他 类 型 变量 的 打 
名 原理 同学 符 串 类 似 。 


11.3 System.out.println () 是 如 何 工 
作 的 


回 到 System.initializeSystemClass () 方法 ， 
进一步 省 略 之 后 ， 其 代码 如 下 : 


// java.lang.System 

public final static PrintStream out = null; 

private static void initializeSystemClass() { 
，V// 其 他 代码 


FileOutputStream fdout = new 
FileOutputStream(FileDescriptor.out); 
setOuto(newPrintStream(fdOut, 
props.getProperty("sun.stdout.encoding"))); 
,，，// 其 他 代码 


setOut0 () 是 个 本 地 方法 ， 代 码 如 下 : 


private static native void setOutoO(PrintStream out); 


newPrintStream () 方法 的 代码 如 下 : 


private static PrintStream newPrintStream(FileOutputStream 
fos, String enc) { 
If (enc != null) { 
try { 
return new PrintStream(new 
BufferedOutputStream(fos, 128), true, enc); 
} catch (UnsupportedEncodingException uee) {} 


} 
return new PrintStream(new BufferedOutputStream(fos, 
128), true); 


由 代码 可 知 ，System.out 常 量 是 PrintStream 类 
型 ， 它 内 部 包 闻 了 一 个 BufferedOutputStream 实 
例 。BufferedOutputStream 内 部 又 包 冯 了 一 个 
FileOutputStream 实 例 。Java 的 io 类 库 使 用 了 装饰 
句 模 式 ， 调 用 System.out.println (String) 方法 之 
后 ， 经 过 层 层 包装 ， 最 后 到 达 FileOutputStream 类 
的 writeBytes () 方法 。 这 个 方法 无 法 用 Java 代 码 
实现 ， 所 以 是 个 本 地 方法 ， 其 代码 如 下 : 


// java.io.FileOutputStream 
public class FileOutputStream extends OutputStream { 
，// 其 他 代码 


private native void writeBytes(byte b[], int off, int 
len, boolean append) 
throws IOException; 


} 


System.setOut0 () 本 地 方法 在 
chll\native\java\lang\System.go 文 件 中 实现 ， 代 码 
如 下 : 


// private static native void setOutO(PrintStream out); 
func setOuto(frame *rtda.Frame) { 
out := frame.LocalVars().GetrRef(0) 
sysClass := frame.Method().class() 
sysClass.SetRefVar("out", "Ljava/io/PrintStream;", out) 


) 


FileOutputStream.writeBytes () 本 地 方法 在 


chll\native\java\io\FileOutputStream.go 文 件 中 实 
现 ， 代 人 码 如 下 : 


// private native void writeBytes(byte b[], int off, int 
len, boolean append) 


// throws IOException; 

func writeBytes(frame *rtda.Frame) { 
vars := frame.LocalVars() 
//this := vars.GetRef(0) 
b := vars.GetRef(1) 
off := vars.GetInt(2) 
len := Vars.GetInt(3) 
//append := vars.GetBoolean(4) 
JBytes := b.Data().([]int8) 
goBytes := castInt8sToUint8s(jBytes) 
goBytes = goBytes[off : off+len] 
os ,Stdout ,Write(goBytes ) 


虽然 同 是 字 万 类 型 ， 但 是 在 Java 语 言 中 byte 是 
有 符号 类 型 ， 在 Go 语言 中 byte 则 是 无 符号 类 型 。 
所 以 这 里 需要 先 把 Java 的 字 市 数组 转换 成 Go 的 
[Jbyte 变 量 ， 然 后 再 调用 os.Stdout.Write () 方法 
把 它 写 到 控制 台 。castInt8sToUint8s () 本 数 代码 
如 下 : 


func castIint8sToUint8s(jBytes []int8) (goBytes [jbyte) { 
ptr := unsafe.Pointer(&jBytes) 
goBytes = *((*[]byte)(ptr)) 
return 


上 


如 朱 读 者 属于 完美 主义 兰 ， 很 容易 会 发 现 这 
里 的 小 瑕 疲 : FileOutputStream 应 该 可 以 处 理 任何 
文件 而 不 仅仅 是 标准 输出 。 没 销 ， 不 过 本 章 束 到 
此 为 上 了 ， 感 兴趣 的 读者 可 以 继续 完 秋 代 码 ， 计 
FileOutputStream 可 以 文 持 任何 文件 。 下 面 测试 本 
草 代 码 。 


11.4 测试 本 章 代码 
打开 命令 行 窗口 ， 执 行 下 面 的 命令 编译 本 章 
代码 : 


go install jvmgo\ch11 


命令 执行 完毕 后 ， 在 D: \go\Wwworkspace\bin 日 
录 下 出 现 ch11.exe 文 件 。 用 ch11.exe 测 试 HelloWorld 
程序 ， 结 果 如 图 11-1 所 示 。 


国 命令 提示 符 口 xX 
D:\go\workspace\bin>chll. exe -Xire "C:\Program Files\Java\irel. 8.0 66”jvmgo. bool 
k. ch0l. HelloWorld 
Hello，worldl 


D:\go\workspace\bin> 


图 11-1 HelloWorld 程 序 执行 结 


11.5 总结 
本 书 共 11 章 ， 各 章 内 容 如 下 ; 


第 1 章 讨 论 了 Java 虚 拟 机 是 如 何 启动 的 ， 介 绍 
了 java 命 令 的 用 法 ， 并 且 实 现 了 一 个 类 似 的 命令 
行 工具 。 


第 2、 第 3、 第 6、 第 8 章 讨 论 了 类 加 载 硕 。 其 
中 第 2 章 讨论 了 Java 虚 拟 机 如 何 搜索 class 文 件 ， 并 
日 实现 了 类 路 径 ， 可 以 把 class 文 件 读 到 内 存 中 。 
第 3 章 讨论 了 class 文 件 结构 体 ， 并 且 实 现 了 class 文 
件 解 析 ， 把 难以 理解 的 字 节 序列 转换 成 了 
ClassFile 结 构 体 。 第 6 章 实现 了 一 个 简化 版 的 类 加 
载 器 ， 进 一 步 处 理 ClassFile 结 构 体 ， 把 它 转换 成 


Class 结 构 体 放 入 方法 区 。 第 8 章 对 类 加 载 器 进行 
了 扩展 ， 使 其 可 以 加 载 数组 类 。 


第 4、 第 6 章 讨 论 了 运行 时 数据 区 。 其 中 第 4 章 
主要 讨论 了 线程 私有 的 运行 时 数据 区 ， 包 括 Java 
虚拟 机 栈 、 帧 、 局 部 变量 表 和 操作 数 栈 等 。 第 6 章 
主要 讨论 了 线程 共享 的 运行 时 数据 区 ， 包 括 方法 
区 和 运行 时 常量 池 等 。 


第 7、 第 9、 第 10 章 讨论 了 方法 调用 。 其 中 第 7 
章 主 要 讨论 了 Java 方 法 的 调用 和 返回 ， 并 且 实 现 
了 相关 指令 。 第 9 章 讨 论 了 本 地 方法 调用 ， 并 且 实 
现 了 Java 类 库 中 一 些 最 重要 的 本 地 方法 。 第 10 草 
讨论 了 寞 单 处 理 ， 并 且 实 现 了 athrow 指 令 。 


第 5 草编 写 了 一 个 简单 的 解释 右 ， 从 这 一 章 开 
始 ， 我 们 陆续 实现 了 约 200 条 指令 。 在 Java 虚 拟 机 
规 苑 已 经 定义 的 205 条 指令 中 ， 只 剩 下 8 条 还 没有 
实现 ， 分 别 是 : 控制 指令 中 的 jsr 和 ret， 扩 展 指令 
中 的 jsr_w; 引用 类 指令 中 的 invokedynamic 、 
monitorenter 和 monitorexit; 以 及 你 留 指 令 中 的 


breakpoint 和 impldep2 。 


不 过 壮 憾 的 是 ， 有 很 多 重要 的 内 容 没 有 讨 
论 : class 文 件 验 证 、 内 存 管 理 和 垃圾 回收 、 类 加 
和 载 怖 的 委派 模型 、 多 线程 、JIT， 等 等 。 如 末 本 书 
有 机 会 出 第 2 版 ， 布 刻 可 以 油 善 这 些 内 容 。 


附 邓 ”指令 表 


Constants 
操作 码 | ” 助 记 符 ”| 
ox00 | nop 
Ox01 | aconst noll | 
0x02 
0x03 | icomsto | 
Ox04 
0x05 | iconst2 
0x06 
0x07 | icomt4 
Ox08 | iconsts 
Ox09 
0x0a | lonstl 


Loads 


到 
wie 
it 
操作 码 
0x21 
0x22 
Ox23 
0x24 
Ox25 


Stores 


谢 
研 


An 
十 


| 器 
心 | 上 | 和 睛 | 本 | 三 | 上 | 三 | 三 | 上 | 二 | 二 


谢 
. 
dt 


操作 码 


0x27 
0x28 


0x29 


0x2b 


8 


0x2d 
0x2e 
Ox2f 

3 
Ox31 


[= 


, 


助 记 符 
dload 0 
dload 1 
dload 2 
dload 3 
aload 0 
aload 1 
aload 2 
aload 3 
iaload 
laload 
faload 
daload 


到 
到 
pt 
mt 
oe 


操作 码 
0x57 
0x58 
0x59 
Ox5a 
0x5b 


dstore 2 
dstore 3 


astore 0 


astore 2 


astofe 3 


fastore 


dastore 


bastore 


castore 


sastore 


章节 
5.6.2 
5.6.2 
3.6.2 
5.6.3 


操作 码 助 记 符 
ox60 | id | 571 | 0 | ing | 
ox6l | hd | S571 | mo | hes | 
ox62 | fdd | 571 | 0 | fas | 
0x63 
ox64 | iswb | 571 | os | ih | 
es | i | 1 | | 
ox66 | fw | 5 | a | ishr | 
mo 
ox69 | ml | 5 | od | kbr | 
ma | S71 | oe | 
Ox6b 
os a 
Ox6d ld lor 
veee a 
Ox6f ddiv Ox83 lxor 
ox70 | Jiem | 571 | 0x84 
on | km | 7 | | | 
bw | Be | || 
oa | ew | SR | | | 
Conversions 

操作 码 章节 操作 码 
0x85 dai 
0x86 
ox87 | za | 58 | om | gf | 
0x88 
Ox89 
Ox8a is 
os | 人 | 5 | | 
os | | 
osd | pa | 5 | | | 


Comparisons 


操作 码 助 记 符 章节 操作 码 
Control 

操作 码 

Oxa7 

Oxa8 

0xa9 

0xaa3 

0xab 


References 


章节 
7.4 
7.4 
7.4 
7.4 
7.4 
7.4 


Extended 


让 


as enemy | ao | m5 | isw 
me i | sm | | 


Oxc7 
Reserved 
操作 码 二 
Oxca 9.2 


